如何计算所有列之间的相关性,并使用python或pandas删除高度相关的列

如何计算所有列之间的相关性,并使用python或pandas删除高度相关的列

我有一个巨大的数据集,并在机器学习建模之前,总是建议首先你应该删除高度相关的描述符(列)如何计算列wice相关性和删除与阈值的列说删除所有的列或描述符具有> 0.8的相关性。 还应该保留在减少数据的标题。 示例数据集 GA PN PC MBP GR AP 0.033 6.652 6.681 0.194 0.874 3.…




scipy是什么 scipy python pandas教程 pandas库 pandas和numpy的关系 pandas numpy用途 numpy教程 numpy关系