python数据分析与机器学习实战—79430人已学习
课程介绍
课程风格通俗易懂,真实案例实战。精心挑选真实的数据集为案例,通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家入门机器学习。 学习收益: 1.掌握Python数据科学工具包,包括矩阵数据处理与可视化展示。 2.掌握机器学习算法原理推导,从数学上理解算法是怎么来的以及其中涉及的细节。 3.掌握每一个算法所涉及的参数,详解其中每一步对结果的影响。 4.熟练使用Python进行建模实战,基于真实数据集展开分析,一步步完成整个建模实战任务。
课程收益
课程目标:零基础快速掌握python数据分析与机器学习算法实战,快速入门python最流行的数据分析库numpy,pandas,matplotlib。对于繁琐的机器学习算法,先从原理上进行推导,以算法流程为主结合实际案例完成算法代码,使用scikit-learn机器学习库完成快速建立模型,评估以及预测。结合经典kaggle案例,从数据预处理开始一步步完成整个项目,使大家对如何应用python库完成实际的项目有完整的经验与概念。
讲师介绍
唐宇迪
更多讲师课程
计算机博士,专注于机器学习与计算机视觉领域,深度学习领域一线实战讲师。在图像识别领域有着丰富经验,实现过包括人脸识别,物体识别,关键点检测等多种应用的新算法。 参与多个国家级计算机视觉项目,多年数据领域培训经验,丰富的教学讲解经验,出品多套机器学习与深度学习系列课程,课程生动形象,风格通俗易懂。
课程大纲
第1章:人工智能入学指南
1.
AI时代首选Python
9:20
2.
Python我该怎么学
4:21
3.
人工智能的核心-机器学习
10:34
4.
机器学习怎么学?
8:36
5.
算法推导与案例
8:18
第2章:Python科学计算库-Numpy
1.
使用Anaconda安装python环境
13:10
2.
Numpy基础操作(课程所有PPT,数据,代码下载)
10:32
3.
Numpy数组结构
10:41
4.
Numpy矩阵基础
5:55
5.
Numpy常用函数
12:01
6.
Numpy矩阵操作
10:18
7.
复制操作对比
10:49
第3章:Python数据分析处理库-Pandas
1.
Pandas数据读取
11:50
2.
Pandas索引与计算
10:26
3.
Pandas数据预处理实例
13:01
4.
Pandas常用预处理方法
11:11
5.
Pandas自定义函数
7:44
6.
Series基本结构
12:29
第4章:Python可视化库-Matplotlib
1.
Matplotlib完成简易折线图
8:24
2.
Matplotlib子图操作
14:04
3.
Matplotlib条形图与散点图
10:11
4.
Matplotlib柱形图和盒图
10:16
5.
Matplotlib子图细节
6:12
第5章:线性回归算法原理推导
1.
线性回归算法概述
14:23
2.
误差项分析
11:32
3.
似然函数求解
9:35
4.
目标函数推导
9:21
5.
线性回归求解
10:57
第6章:梯度下降策略
1.
梯度下降原理
11:42
2.
梯度下降方法对比
7:20
3.
学习率对结果的影响
6:08
第7章:逻辑回归算法
1.
1-逻辑回归算法原理推导
10:52
2.
2-逻辑回归求解
14:58
第8章:Python实现逻辑回归与梯度下降
1.
案例实战:Python实现逻辑回归任务概述
7:33
2.
案例实战:完成梯度下降模块
12:51
3.
案例实战:停止策略与梯度下降案例
10:55
4.
案例实战:实验对比效果
10:25
第9章:案例实战:信用卡欺诈检测
1.
案例背景和目标
8:31
2.
2-样本不均衡解决方案
10:17
3.
下采样策略
6:35
4.
交叉验证
13:02
5.
模型评估方法
13:05
6.
正则化惩罚
8:09
7.
逻辑回归模型
7:37
8.
混淆矩阵
8:52
9.
逻辑回归阈值对结果的影响
10:00
10.
SMOTE样本生成策略
15:50
第10章:决策树算法
1.
决策树原理概述
12:25
2.
衡量标准-熵
11:03
3.
决策树构造实例
10:08
4.
信息增益率
5:48
5.
决策树剪枝策略
15:31
第11章:集成算法与随机森林
1.
集成算法-随机森林
12:02
2.
特征重要性衡量
13:50
3.
提升模型
11:14
4.
堆叠模型
7:09
第12章:决策树算法实例
1.
案例:决策树涉及参数
11:08
2.
案例:树可视化与sklearn库简介
18:14
3.
案例:sklearn参数选择
11:46
第13章:案例实战:泰坦尼克号获救预测
1.
船员数据分析
6:09
2.
数据预处理
13:35
3.
使用回归算法进行预测
14:30
4.
使用随机森林改进模型
12:56
5.
随机森林特征重要性衡量
10:39
第14章:贝叶斯算法
1.
贝叶斯算法概述
6:58
2.
贝叶斯推导实例
7:37
3.
贝叶斯拼写纠错实例
11:46
4.
垃圾邮件过滤实例
14:09
5.
贝叶斯实现拼写检查器
12:20
第15章:EM算法与GMM实践
1.
EM算法要解决的问题
10:38
2.
隐变量问题
6:16
3.
EM算法求解实例
14:31
4.
Jensen不等式
10:46
5.
GMM模型
9:19
6.
GMM实例
11:50
7.
GMM聚类
9:44
第16章:支持向量机原理推导
1.
支持向量机要解决的问题
10:05
2.
距离与数据的定义
10:33
3.
目标函数
9:41
4.
目标函数求解
11:27
5.
SVM求解实例
13:45
6.
支持向量的作用
11:53
7.
软间隔问题
6:46
8.
SVM核变换
16:51
第17章:SVM调参实战
1.
sklearn求解支持向量机
11:24
2.
SVM参数选择
14:00
第18章:聚类算法-KMEANS
1.
KMEANS算法概述
11:33
2.
KMEANS工作流程
9:42
3.
KMEANS迭代可视化展示
8:19
第19章:聚类算法-DBSCAN
1.
DBSCAN聚类算法
11:03
2.
DBSCAN工作流程
15:03
3.
DBSCAN可视化展示
8:52
第20章:聚类实践
1.
多种聚类算法概述
4:34
2.
聚类案例实战
17:19
第21章:PCA降维算法
1.
PCA降维概述
8:39
2.
PCA要优化的目标
12:21
3.
PCA求解
10:17
4.
PCA降维实例
19:17
第22章:神经网络算法
1.
计算机视觉领域的挑战与机器学习常规套路
9:40
2.
K近邻来进行图像分类任务
10:01
3.
超参数与交叉验证
10:30
4.
线性分类
9:34
5.
损失函数
9:17
6.
神经网络正则化惩罚项
7:19
7.
softmax分类器
13:38
8.
反向传播原理
15:16
9.
神经网络-最优化问题
6:46
10.
神经网络梯度下降原理
11:48
11.
神经网络整体架构
10:11
12.
神经网络实例演示
10:38
13.
过拟合解决方案
15:53
14.
感受神经网络的强大
11:30
第23章:Xgboost集成算法
1.
Xgboost算法概述
11:35
2.
Xgboost模型构造
12:10
3.
Xgboost建模衡量标准
12:07
4.
Xgboost安装
3:31
5.
xgboost实例演示
14:43
第24章:机器学习建模流程与BenchMark
1.
HTTP检测任务与数据挖掘的核心
11:13
2.
论文的重要程度
10:00
3.
BenchMark概述
6:23
4.
BenchMark的作用
13:31
第25章:K近邻算法实战
1.
K近邻算法概述
15:47
2.
模型的评估
10:39
3.
数据预处理
11:25
4.
sklearn库与功能
14:42
5.
多变量KNN模型
16:37
第26章:随机森林实例
1.
随机森林的回归任务
18:30
2.
数据还是多点好
13:24
3.
速度与精度的权衡
13:06
4.
调参策略
17:10
第27章:数据特征
1.
基本数值特征
11:14
2.
常用特征构造手段
13:53
3.
时间特征处理
13:04
4.
文本特征处理
20:24
5.
构造文本向量
11:45
6.
词向量特征
13:55
7.
计算机眼中的图像
5:46
第28章:集成算法实例
1.
集成算法实例概述
10:51
2.
ROC与AUC指标
10:03
3.
基础模型
9:32
4.
集成实例
18:53
5.
Stacking模型
14:16
6.
效果改进
11:09
大家可以点击【
查看详情
】查看我的课程
版权声明:本文为tangyudi原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。