来源:mush博客
学习机器技术与算法
虽然本教程专门用于Python中的机器学习技术,但我们很快就会转向算法。但在我们开始关注技术和算法之前,让我们看看它们是否是同一个东西。
一个
技术
的英文解决问题的一种方式。这是一个非常通用的术语。但是我们当说我们有一个
算法时
,我们的意思是我们有一个输入并希望从中得到一定的输出。我们已明确规定了实现目标的步骤。我们将竭尽全力说算法可以利用多种技术来获得输出。
现在我们已经区分了两者,让我们更多地了解机器学习技术。
Python中的机器学习技巧
机器学习回归
该
字典搜索
会告诉你,倒退是回到过去的状态-的英文一个不太发达在有关研究技术Investigative Technique的书籍中,您会发现回归可以衡量一个变量的平均值和其他值的对应值如何相互关联。但是让我们来谈谈你将如何看待它。
回归均值
查尔斯达尔文的半表兄弟弗朗西斯高尔顿观察了几代人的甜豌豆的大小。他得出的结论是,让大自然发挥作用将导致各种规模。但是,如果我们选择性地培育大小的甜豌豆,就会它产生更大的豌豆随着方向盘的自然,更大的豌豆开始随着时间的推移产生更小的后代。我们对豌豆有一定的大小,但我们可以将这些值映射到特定的线或曲线。
另一个例子:猴子和股票
1973年,普林斯顿大学教授伯顿·马尔基尔(Burton Malkiel)在他的着作
“随机漫步华尔街”(The Random Walk Down Wall Street)中提出
了一个主张,该书 是一本畅销书,并坚持认为蒙着眼睛的猴子可以做专家,通过投掷飞镖来选择投资组合。在报纸的财经页面上。在这样的选股比赛中,猴子击败了职业选手。但这只是一两次。有足够的事件,猴子的表现下降; 它回归到了卑鄙。
什么是机器学习回归?
在该图中,该线最适合由点标记的所有数据。使用这一行,我们可以预测x = 70时会找到什么值(具有一定程度的不确定性)。
作为一种机器学习技术,回归在监督学习中找到了基础。我们使用它来预测连续和数值目标,并从处理我们已知的数据集值开始。它比较已知值和预测值,并将预期值和预测值之间的差异标记为误差/残差。
机器学习中的回归类型
我们一般会观察两种回归:
-
线性回归:
当我们可以用
直线
表示目标状语从句:预测变量之间的关系时,我们使用线性回归,如下所示:
Y = P1X + P2 + E.
-
非线性回归:
当我们观察目标和预测变量之间的非线性关系时,我们不能将其表示为直线。
机器学习分类
什么是机器学习分类?
的英文分类照片一种
数据挖掘
技术,可以让我们预测数据实例的组成员资格。这预先使用标记数据并且受监督学习。这意味着我们培训数据并期望预测其未来。通过’预测’,我们意味着我们。数据将分类照片为它们可以属于的类我们有两种属性:
-
属性输出
或从属属性。 -
属性输入侧
或独立属性。
分类方法
-
决策树归纳:
我们从标记为
元型态组
的类构建决策树 。。它具有内部节点,分支和叶节点。内部节点表示对属性,分支,测试结果,节点叶类状语从句:标签的测试涉及的两个步骤是学习和测试,这些都很快。 -
基于规则的分类:
此分类基于一组IF-THEN规则。规则表示为:
如果条件那么结论
-
通过反向传播进行分类:
。神经网络学习(通常称为连接学习)构建连接。反向传播是一种神经网络学习算法,最受欢迎的英文的算法之一它迭代地处理数据并将目标值与要学习的结果进行比较。 -
懒惰的学习者:
在懒惰的学习者方法中,机器存储训练元组并等待测试元组。这支持增量学习。这与早期学习者方法形成对比。
ML分类示例
我们来举个例子吧。考虑一下我们在这里教你不同类型的代码。我们为你呈现ITF条形码,Code 93条形码,QR码,Aztec和数据矩阵等。通过大多数示例,现在轮到您确定我们向你展示时的代码类型了。这是有监督的学习,我们使用了部分示例 – 培训和测试。
注意每种类型的某些恒星最终是如何在曲线的另一侧。
聚类
聚类是一种无监督的分类。这是一种探索性数据分析,没有标记数据,通过聚类,我们将未标记的数据分离为自然和隐藏的有限和离散数据结构集。我们观察到两种聚类 –
-
硬聚类:
一个对象属于单个集群。 -
软聚类:
一个对象可能属于多个聚类。
在聚类中,我们首先选择特征,然后设计聚类算法,然后验证聚类。最后,我们解释结果。
示例
回想上面的示例。您可以将这些代码组合在一起.QQ码,Aztec和Data Matrix将属于一个群组; 我们可以称之为二维码.ITF条形码和Code 39条形码将分组为“一维代码” “类别。这就是集群的样子:
异常检测
异常是偏离预期的过程。有机器学习,有时我们可能想要发现异常值。一个这样的例子是每小时检测牙医账单85填充物。这相当于每位患者42秒。另一种方法是仅在周四才能找到特定的牙医账单。这种情况引起了怀疑,异常检测是突出这些异常情况的好方法,因为这不是我们特别需要的。
所以,这完全是关于Python中的机器学习技术。