特征降维
减少特征的个数,得到不相关的主成分特征
-
特征选择
-
Filter过滤式
- 方差选择法:低方差过滤
from sklearn.feature_selection import VarianceThreshold
- 相关系数法
-
Embedding 嵌入式
- 决策树
- 正则化
- 深度学习
-
-
sklearn模块
feature_selection
主成分分析
API
from sklearn.decomposition import PCA
# PCA(n_components)
# n_components:传入整数表示减少到多少特征,小数表示保留多少的信息
代码示例
from sklearn.decomposition import PCA
def pcaDemo():
data=[[2,8,4,5],
[6,3,0,8],\
[5,4,9,1]]
transfer = PCA(n_components=0.95)
data_new = transfer.fit_transform(data)
print(data_new)
if __name__ == '__main__':
pcaDemo()
输出
[[ 1.28620952e-15 3.82970843e+00]
[ 5.74456265e+00 -1.91485422e+00]
[-5.74456265e+00 -1.91485422e+00]]