关注公众号,发现CV技术之美
图数据是对事物间联系的一般抽象,广泛存在于我们的日常生活中,例如社交网络、交通网络、推荐系统和互联网等。
作为图数据分析与挖掘的一种新范式,图表征学习(Graph Representation Learning)是近年来机器学习与数据挖掘领域的热门研究方向。
概括来说,
图表征学习
是指学习图中的元素,例如节点、边、子图或整个图的向量表征,并应用基于向量的机器学习算法进行图数据的建模与分析。
图表征学习有许多优点,包括从人工特征到自动表征、机器学习模型的适用性、大规模图的可扩展性等,使其在学术界和工业界都受到了广泛关注,并自2014 年开始取得了长足的进展。
例如,根据谷歌学术2022 年的统计结果,图表征学习的一种代表性方法——图卷积神经网络(Graph Convolutional Network,GCN),在人工智能顶级国际会议ICLR(International Conference on LearningRepresentations)过去五年发表的论文中引用量排名第一,已被引用超过2 万次;在2019 年,阿里巴巴达摩院将“超大规模图神经网络系统将赋予机器常识”列为“2019 十大科技趋势”之一。图灵奖得主约书亚·本吉奥(YoshuaBengio)曾指出:“将神经网络扩展到图结构输入是机器学习当前的主要挑战之一”。
此外,在工业界,国内外许多互联网大厂均开发了自己的图表征学习系统,包括但不限于百度的PGL(Paddle Graph Learning)、阿里巴巴的欧拉(Euler)与Graph-Learn、腾讯的柏拉图(Plato)、亚马逊的DGL(Deep Graph Library)、谷歌的TensorFlow-GNN、DeepMind 的GraphNets、Meta 的PBG(Pytorch BigGraph)等。
这些情况表明,图表征学习无论在科研还是应用方面,都具有巨大的潜力与价值,并受到了更广泛的关注。
进一步地,许多图数据都处于动态开放环境(Dynamic and Open Environments)之中。其中,
动态环境
是指图数据,包括结构、特征、性质、任务等,随时间发生变化。
开放环境
则泛指数据分布、学习目标、特征或标签等因素在机器学习过程或应用场景中发生变化。
例如,
-
在社交网络中,用户间会随时间形成新的关系并删除旧的关系,也可能有新的用户加入,旧的用户退出,且社交网络的演化规律也在不断变化;
-
在交通网络中,不同时刻的道路情况、车流量、外界环境与所发生的事件也在不断变化;
-
在生物网络中,新的疾病(例如新冠病毒)可能具有与以往疾病不同的特性与机理,因此开发新的药物需要考虑多种复杂因素。
如何处理动态开放环境下的图数据对图表征学习提出了更大的挑战,也因此吸引了许多研究者的关注。
考虑到图表征学习的快速发展和广泛应用,
《图表征学习:迈向动态开放环境》
一书希望尽量全面地介绍图表征学习。
本书作者
所在的研究团队——清华大学多媒体与网络实验室,从2014 年左右开始关注图表征学习,并见证了这个领域从新兴,甚至可以说一开始相对小众,发展到目前受到各行各业的广泛关注,并成为一个机器学习和深度学习重要分支的全过程。本书作者基于在该方向的研究积累,并查阅了大量相关资料,费时约两年,写成了这本书。
本书将全面介绍图表征学习,特别是针对处于真实世界动态、开放环境之中图数据的图表征学习方法。
本书分为3 篇:
-
第1篇介绍图嵌入和图神经网络等经典图表征学习方法;
-
第2篇围绕鲁棒性、动态性、可解释性、分布外泛化性等多个角度,系统地介绍针对动态开放环境中的图表征学习方法;
-
第3篇以四个不同领域为例,从推荐系统、交通预测、自然语言处理、组合优化等场景,介绍图表征学习的应用方法。
除了对代表性方法进行详细介绍,本书还提供了
丰富的参考文献
,读者可以更深入地学习图表征学习的前沿内容。
本书适合
具有一定机器学习基础的高年级本科生、研究生、教师和研究者,以及对图数据感兴趣的计算机工程师和从业人员阅读,也适合对人工智能、深度学习和图数据分析感兴趣的其他人士参考。
限时满100减50
互动赠书
在本文下方留言区推荐一篇
近期所读论文以及简述推荐理由
,如:
论文:Local-Global Information Interaction Debiasing for Dynamic Scene Graph Generation
地址:https://arxiv.org/abs/2308.05274
将由CV君选取
5位
小伙伴(走心且要对别人有价值),赠送
《图表征学习:迈向动态开放环境
》
一书。
活动截止时间
:2023.8.17-9:00
END
欢迎加入「计算机视觉
」
交流群?备注:
CV