知识图谱是什么,知识图谱有什么特点?

  • Post author:
  • Post category:其他


知识图谱本质上是一种语义网络,是基于图的数据结构,以图的方式存储知识并向用户返回经过加工和推理的知识。它由“节点”和“边”组成,节点表示现实世界中的“实体”,边表示实体之间的“关系”。

一般来说,知识图谱分为通用知识图谱和领域知识图谱。其中,通用知识图谱主要由各大搜索引擎公司研究,以提高搜索准确率,争取直接给出目标答案;而领域知识图谱可根据领域特定的情况,提供各种针对性的应用。

具体到金融领域,因为涉及到各行各业,包含了经济、产业、公司等众多方面的知识,所以金融知识图谱相对于其他领域比较特别。具体来说,金融知识图谱常见的实体包括:公司、产品、证券和人员等。实体间的关系包括:股权关系、任职关系、担保关系、供应商关系、竞争对手关系、生产关系、采购关系和上下游关系等(参见下图)。其中,有些实体和关系,可以自动抽取生成,如股权关系和任职关系等,均可在工商局注册登记平台得到公开信息。而产品间的上下游关系则需要有系统性的数据源,这就给信息获取和识别带来了巨大的挑战。

知识图谱有什么特点?

知识图谱可以最有效、最直观地表达出实体间的关系。简单地说,就是把大量不同种类的信息连接在一起而得到一个关系网络,为人们提供了从“关系”的角度分析问题的能力。

相对于传统的描述方式,知识图谱具有一些自身的特点:

先来看第一个步骤:实体的识别是从文本中抽取出特定的实体信息,如时间、人物、地点、公司、产品等等,由此确定了知识图谱中的点。

再来看第二个步骤:关系的识别则是指实体间的各种关系,如地理位置关系、雇佣关系、股权关系等等,这些关系确定了点与点之间的边。需要说明的是,常用的抽取关系的方法有基于专家知识库和基于机器学习等类型。其中,基于专家知识库的方法是由行业专家构筑大规模的领域知识库,需要专家参与,一般耗时费力,但是质量相对比较可靠;机器学习的方法需要构造特征向量形式的训练数据,使用机器学习算法自动构造。需要特别指出的是,对于非结构化文本,实体识别和关系抽取需要基于自然语言处理算法,以及深度学习算法(例如,用词向量的方式寻找近义词,提高实体模糊识别的准确度),这是一个反复迭代、不断精进的过程。

最后来看第三个步骤:推理能力是人类智能的重要特征,是由一个或几个已知的前提推出结论的过程,也可以从已有的知识中发现隐含的知识。在推理的过程中,往往需要一些规则的支持,例如:从“某人甲”既是“企业A”的法人也是“企业B”的法人,可以推测出“企业A”和“企业B”之间的关联关系。当然,这里会涉及到概率的问题。当信息量特别多的时候,如何把这些信息有效地与推理算法结合在一起是最关键、最有挑战性的工作。常用的推理算法包括基于逻辑和基于分布式表示的方法。随着深度学习在人工智能领域取得的突破,基于分布式表示的方法已成为目前研究的热点。

此外,金融知识图谱还包含了很多其他的形式,例如:A股的公司、港股和美股的公司,各种基本面的数据、行情的数据都在逐渐的知识图谱化,还有公告数据、研报数据、以及工商数据等都是金融知识图谱的分支。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:

1.人工智能时代,AI人才都有哪些特征?


http://www.duozhishidai.com/article-1792-1.html


2.大数据携手人工智能,高校人才培养面临新挑战


http://www.duozhishidai.com/article-7555-1.html


3.人工智能,机器学习和深度学习之间,主要有什么差异


http://www.duozhishidai.com/article-15858-1.html


如何构建一个有效的知识图谱,知识图谱构建过程主要分为哪几个步骤?


http://www.duozhishidai.com/article-2204-1.html



多智时代-

人工智能



大数据

学习入门网站|人工智能、大数据、

物联网



云计算

的学习交流网站



版权声明:本文为duozhishidai原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。