《深度学习的数学——使用Python语言》5. 数据的相关性
不同的数据集之间可能会存在关联,如一方变大,另一方也随之变大或者变小。例如,大多数图像的像素点是高度相关的。图像上的一个像素与其周围的像素点在很大概率上会类似。而”相关性“十分适合用于描述这种关系,描述相关性的统计量能够清晰地体现出数据特征之间有何关联。在传统的机器学习领域,我们并不希望不同特征之间有很强的关联性,因为这样不但难以提供新的信息,还会对模型产生干扰。因此,在传统的机器学习领域,通常需要对获得的数据进行特征工程,其中一项目的就是去吃相关性的影响。然而在深度学习领域,由于深度网络本身