机器学习:什么是无监督学习(Unsupervised Learning)?

  • Post author:
  • Post category:其他

概念

  1. 上一片文章我们了解了监督学习,监督学习是一种目的明确的训练方式,通过已知因素和已知的结果,通过机器训练,是机器能学会通过已知因素得到未知的结果。而无监督学习是通过给未知的数据,进行分类,也许你就会问了,我都不知道有什么规律,我怎么区分类呢?这就是用到算法模型了。
  2. wiki:无监督学习(英语:unsupervised learning)是机器学习的一种方法,没有给定事先标记过的训练示例,自动对输入的资料进行分类或分群。无监督学习的主要运用包含:聚类分析(cluster analysis)、关系规则(association rule)、维度缩减(dimensionality reduce)。它是监督式学习和强化学习等策略之外的一种选择。
    一个常见的无监督学习是数据聚类。在人工神经网络中,生成对抗网络(GAN)、自组织映射(SOM)和适应性共振理论(ART)则是最常用的非监督式学习。
  3. 这么看下来非监督学习比监督学习的逼格真的是高了很多
    在这里插入图片描述

总结:

  • 无监督学习是一种机器学习的训练方式,它本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构的一种训练方式。
  • 几个特点:
    1. 无监督学习没有明确的目的
    2. 无监督学习不需要给数据打标签
    3. 无监督学习无法量化效果

无监督学习的例子

发现异常(风控)

  1. 违法的洗钱行为,洗钱的用户和不洗钱的用户在某些特征上总是有区别的,但是在一个超大账户上,我们并不知道那些是正常用户,那些事非正常用户。所以我们采用无监督学习,将这些用户通过各个特征进行分类,通过分完类的快速分析出正常用户,然后通过更加深入的分析得到异常用户的特征

用户细分

这个对于广告平台很有意义,我们不仅把用户按照性别、年龄、地理位置等维度进行用户细分,还可以通过用户行为对用户进行分类。

通过很多维度的用户细分,广告投放可以更有针对性,效果也会更好。

案例3:推荐系统

大家都听过”啤酒+尿不湿”的故事,这个故事就是根据用户的购买行为来推荐相关的商品的一个例子。

比如大家在淘宝、天猫、京东上逛的时候,总会根据你的浏览行为推荐一些相关的商品,有些商品就是无监督学习通过聚类来推荐出来的。系统会发现一些购买行为相似的用户,推荐这类用户最”喜欢”的商品。

常见的2类无监督算法

1. 聚类

  • 简单说就是一种自动分类的方法,在监督学习中,你很清楚每一个分类是什么,但是聚类则不是,你并不清楚聚类后的几个分类每个代表什么意思。

2. 降维

  • 降维看上去很像压缩。这是为了在尽可能保存相关的结构的同时降低数据的复杂度。
    在这里就不细说了,明天详细讲解

总结

无监督学习,通过几种算法模型,给未知的数据进行分类,再根据这些数据分析这些数据的特征。

参考:

  • https://easyai.tech/ai-definition/unsupervised-learning/
  • https://zh.wikipedia.org/wiki/%E7%84%A1%E7%9B%A3%E7%9D%A3%E5%AD%B8%E7%BF%92

版权声明:本文为weixin_40413961原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。