Python标准机器学习库— —sklearn学习入门(一)

  • Post author:
  • Post category:python




从本部分内容开始,主要分享学习


sklearn


库的基本心得和主要收获。




1、数据集的基本使用方法



以手写数据集的使用为例



使用

from sklearn.datasets import load_digits

加载数据集


参数


return_X_y:

默认为false,表示以字典形式返回数据的全部信息(data和target);若为True,则以(data,target)的形式返回数据。


n_class:

表示返回数据的类别数,如 n_class=5,则返回0到4的数据样本;


使用该数据集的示例:

digit = load_digits()        #默认时false,n_class=10
print(digit.data.shape)
print(digit.images.shape)
plt.matshow(digit.images[0]) 
plt.show()



2、sklearn的基本功能

主要包括回归、分类、聚类、降维、模型旋转、数据的预处理.



常用的分类模型及其调用方法

分类模型 加载模块
最近临近法 neighbors.NearestNeighbors
支持向量机 svm.SVC
朴素贝叶斯 native_bayes,GaussianNB
决策树 tree.DecisionTreeClassifier
集成方法 ensemble.BaggingClassifier
神经网络 neural_network.MLPClassifier



常用的回归模型及其调用方法

回归模型 加载模块
岭回归 linear_model.Ridge
Lasso回归 linear_model.Lasso
弹性网络 linear_model.ElasticNet
最小角回归 linear_model.Lars
贝叶斯回归 linear_model.BayesianRidge
逻辑回归 linear_model.LogisticRegression
多项式回归 linear_model.PolynomialFeatures



常用的聚类模型及其调用方法

聚类模型 加载模块
K-means cluster.KMeans
AP聚类 cluster.AffinityPropagation
均值漂移 cluster.MeanShift
层次聚类 cluster.AgglomerativeClustering
DBSCAN cluster.DBSCAN
BIRCH cluster.Birch
谱聚类 cluster.SpectralClustering



常用的降维模型及其调用方法

降维模块 加载模块
主成分分析 decomposition.PCA
截断SVD和LSA decomposition.TruncatedSVD
字典学习 decomposition.SparseCoder
因子分析 decomposition.FactorAnalysis
独立成分分析 decomposition.FastICA
非负矩阵分解 decomposition.NMF
LDA decomposition.LatenDirichletAllocation



3、机器学习的分类

  • 无监督学习:Supervised Learning
  • 监督学习:Unsupervised Learning
  • 半监督学习:Semi-supervised Learning
  • 强化学习:Reinforcement Learning
  • 深度学习:Deep Learning


下面的章节将主要按照模块讲解各个模块的功能及其常见用法,欢迎继续关注.



版权声明:本文为tust123qht原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。