主要对知识图谱概念进行一个讲解,以及知识图谱中是如何进行知识表示的。
实践:用Protege进行一个Game的本体构建
知识图谱概述
什么是知识图谱?
知识图谱以结构化的形式描述客观世界中
概念
、
实体
及其
之间的关系
。
概念: 抽象出来的事物, 比如称号、 身份、 职业等
实体: 具体的事物, 比如地名、 人、 组织机构等
概念与概念之间、 概念与实体之间、 实体与实体之间, 存在着关系。 比如: < 姚明, 出生地, 上海 > <F1 赛车, 类别, 单座赛车>
知识图谱的定义
从狭义上讲, 知识图谱是一种
知识描述语言
, 它是语义网络的思想在语义网 上的具体实施, 使得互联网知识元素以及知识元素之间的关系具有明确的语义和规范的描述, 从而易于互联网知识资源的规模化建设, 并互相链接, 促进知识资源的共享, 从而通过知识推理与知识计算赋能各种互联网服务。
从广义上讲, 知识图谱是一个
包括知识表示、 知识构建、 知识维护以及知识应用的完整生态系统
, 它不仅包含了特定领域中的知 识定义和实例数据, 还包含了支撑描述、 构建、 存储、 管理和应用知识所需的配套标准、 技术和工具。
知识图谱中的知识表示
本体
(Ontology) 通过对于
概念
(Concept) 、
术语
(Terminology) 及其
相互关系
(Relation, Property) 的规范化 (Conceptualization) 描述, 勾画出
某一领域的基本知识体系和描述语言
。
Ontology : 共享概念化的规范, 涉及概念、 关系和公理三个要素。
KG(Knowledge Graph) : 服从于 ontology 控制的知识单元的载体。
知识组织形式
本体( Ontology ):树状结构, 不同层节点之间是严格的IsA 关系
- 优点: 可以适用于知识的推理
- 缺点: 无法表示概念的二义性(运动员:体育?人物?)
Taxonomy:树状结构, 上下位节点之间非严格的IsA关系
- 优点: 可以表示概念的二义性(体育 —> 运动员)
- 缺点: 不适用于推理, 无法避免概念冗余(餐厅: 美食?机构?地点?)
Folksonomy :类别标签, 更加开放
- 优点: 能够涵盖更多的概念
- 缺点: 如何进行标签管理?
基于Protege的本体构建
Protege是斯坦福大学医学院生物信息研究中心基于 Java 语言开发的本体编辑和知识获取软件, 或者说是本体开发工具。
尝试构建Game的本体
1.打开protege,修改IRI
2. 选择Entities,右击 owl:Thing , 选择Create class hierarchy
3.选择continue,完成本体构建
4.添加本体的对象属性ObjectProperty:在Entities下选择Object properties,选中owl:topObjectProperty
5.为每个对象定义其对应的Domain(表示域,指定当前关系的主语类型)和Range(取值范围,指定当前关系的宾语类型 )
hasDifficulty的主语类型是Game,宾语类型是ValuePartition
hasPlatform的主语类型是Game,宾语类型是Platform
hasGenre 的主语类型是Game,宾语类型是Genre
6.以上是公理约束的添加方法,我们也可以对指定的类添加公理
例如:为Chess游戏添加以下公理
选择Classes下面的Game,找到Chess ,右侧选择SubClass of,弹框选择Class expression editor
7.下面实现将DifficultyValuePartition类进一步定义,与Hard or Normal or Easy进行等价关联
找到DifficultyValuePartition,右侧选择Equivalent to定义游戏难度Hard or Normal or Easy
原来的hasDifficulty中的Ranges可以改成DifficultyValuePartition
然后就可以删除原来的ValuePartition
8.添加自定义类:选择Game,右击选择add subclass
例如:添加多人游戏,定义MultPlayerGame类
添加公理,选择Subclass of
添加可定义类:选择Edit,点击Convert to defined class
9.OntoGraf可视化,查看定义好的本体
在Window里面选择Tabs,点击OntoGraf
查看类与关系
10.对可定义的类,可以做一个简单推理
选择推理器
点击Configure查看推理器是否报错
开始推理
推理结果
通过推理,可以看到MultiPlayerGame,也就是多人游戏中多了chess