从本部分内容开始,主要分享学习
sklearn
库的基本心得和主要收获。
1、数据集的基本使用方法
以手写数据集的使用为例
使用
from sklearn.datasets import load_digits
加载数据集
from sklearn.datasets import load_digits
参数
return_X_y:
默认为false,表示以字典形式返回数据的全部信息(data和target);若为True,则以(data,target)的形式返回数据。
n_class:
表示返回数据的类别数,如 n_class=5,则返回0到4的数据样本;
使用该数据集的示例:
digit = load_digits() #默认时false,n_class=10
print(digit.data.shape)
print(digit.images.shape)
plt.matshow(digit.images[0])
plt.show()
2、sklearn的基本功能
主要包括回归、分类、聚类、降维、模型旋转、数据的预处理.
常用的分类模型及其调用方法
分类模型 | 加载模块 |
---|---|
最近临近法 | neighbors.NearestNeighbors |
支持向量机 | svm.SVC |
朴素贝叶斯 | native_bayes,GaussianNB |
决策树 | tree.DecisionTreeClassifier |
集成方法 | ensemble.BaggingClassifier |
神经网络 | neural_network.MLPClassifier |
常用的回归模型及其调用方法
回归模型 | 加载模块 |
---|---|
岭回归 | linear_model.Ridge |
Lasso回归 | linear_model.Lasso |
弹性网络 | linear_model.ElasticNet |
最小角回归 | linear_model.Lars |
贝叶斯回归 | linear_model.BayesianRidge |
逻辑回归 | linear_model.LogisticRegression |
多项式回归 | linear_model.PolynomialFeatures |
常用的聚类模型及其调用方法
聚类模型 | 加载模块 |
---|---|
K-means | cluster.KMeans |
AP聚类 | cluster.AffinityPropagation |
均值漂移 | cluster.MeanShift |
层次聚类 | cluster.AgglomerativeClustering |
DBSCAN | cluster.DBSCAN |
BIRCH | cluster.Birch |
谱聚类 | cluster.SpectralClustering |
常用的降维模型及其调用方法
降维模块 | 加载模块 |
---|---|
主成分分析 | decomposition.PCA |
截断SVD和LSA | decomposition.TruncatedSVD |
字典学习 | decomposition.SparseCoder |
因子分析 | decomposition.FactorAnalysis |
独立成分分析 | decomposition.FastICA |
非负矩阵分解 | decomposition.NMF |
LDA | decomposition.LatenDirichletAllocation |
3、机器学习的分类
- 无监督学习:Supervised Learning
- 监督学习:Unsupervised Learning
- 半监督学习:Semi-supervised Learning
- 强化学习:Reinforcement Learning
- 深度学习:Deep Learning
下面的章节将主要按照模块讲解各个模块的功能及其常见用法,欢迎继续关注.
版权声明:本文为tust123qht原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。