当前标签: PCA
主成分分析(PCA)原理详解
“微信公众号” 本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s/Xt1vLQfB20rTmtLjiLsmww <https://mp.weixin.qq.com/s/Xt1vLQfB20rTmtLjiLsmww>本文同步更新在我的知乎专栏里面: <https://zhu...
2018-06-09 15:08
阅读(633)
PCA为什么要进行中心化
如果没有对数据做中心化,那算出来的第一主成分的方向可能就不是一个可以“描述”(或者说“概括”)数据的方向了。还是看图比较清楚。 黑色线就是第一主成分的方向。只有中心化数据之后,计算得到的方向才能比较好的“概括”原来的数据。 ...
2018-05-08 11:06
阅读(888)
PCA算法
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一。 参考:http://www.cnblogs.com/pinard/p/6239403.html <http://www.cnblogs.com/pinard/p/6239403.html> PCA...
2018-04-22 21:25
阅读(426)
使用主成分分析(PCA)方法对数据进行降维
我们知道当数据维度太大时,进行分类任务时会花费大量时间,因此需要进行数据降维,其中一种非常流行的降维方法叫主成分分析。 Exploratory Data Analysis 鸢尾花数据集: import numpy as np from sklearn.datasets import load_iris iri...
2018-03-25 17:54
阅读(361)
Iris鸢尾花卉数据集算法练习——PCA和K近邻分类器
本文章主要以sklearn中的Iris鸢尾花数据集为训练对象,练习了PCA和K-近邻算法的使用,以下为笔记内容: Iris数据集也叫安德森鸢尾花卉数据集,通过测量了三种不同花卉(山鸢尾、变色鸢尾和维吉尼亚鸢尾)的萼片及花瓣的长、宽度得到该数据集,如下: from sklearn import datasets ir...
2018-03-18 16:34
阅读(685)
主成分分析(PCA)与Kernel PCA
本博客在之前的文章【1】中曾经介绍过PCA在图像压缩中的应用。其基本思想就是设法提取数据的主成分(或者说是主要信息),然后摒弃冗余信息(或次要信息),从而达到压缩的目的。本文将从更深的层次上讨论PCA的原理,以及Kernel化的PCA。 首先我们来考察一下,这里的信息冗余是如何体现的。如下图中的左图所示,...
2018-03-01 03:21
阅读(238)
【机器学习】数据降维—核主成分分析(Kernel PCA)
本文代码推荐使用Jupyter notebook跑,这样得到的结果更为直观。 KPCA:将非线性可分的数据转换到一个适合对齐进行线性分类的新的低维子空间上。 非线性函数: Φ为一个函数,能够对原始的特征进行非线性组合,将原始的d维数据集映射到更高的k维特征空间。 利用核PCA可以通过非线性映...
2018-02-03 13:33
阅读(312)
【机器学习】数据降维—主成分分析(PCA)
本文代码推荐使用Jupyter notebook跑,这样得到的结果更为直观。 主成分分析(PCA) 特征抽取通常用于提高计算效率,降低维度灾难。 主成分分析(Principe component analysis,PCA): 是一种广泛应用于不同领域的无监督线性数据转换技术,作用是降维。 ...
2018-02-02 10:44
阅读(262)