事件抽取与事理图谱的N个问题

  • Post author:
  • Post category:其他


1、事件是分为两个层次的,底层是抽象层,上层是实例层。底层是对一类事件的抽象归类和形式化表征,这种抽象和形式化表征将时间和空间两个维度的信息进行剔除;实例层是对抽象事件的一种信息的补充和肉体化,其中的信息包括时间维度、空间维度、参与者维度等多方面的信息。

2、事件的形式化。事件根据参与方的多少可以形式化为不同的形式,如:单一动作事件,如爆炸,死亡、出生。这种事件的形式化表示,转化成计算机认知的处理形式。

3、事件的论元。事件是领域性的,领域性的特性由领域性的触发词和标记词进行标记的。我一直在寻求一个通用的事件表示框架。这种表示框架能够最大程度上地将事件的特征信息和各个维度的信息进行揭示。这种维度能够尽可能将与该事件相关联的万物都囊括进来。我将这种囊括的过程称为实体之间的链接。

4、整个人类社会认知都是标签驱动的。所以,无论是事件抽取还是事理图谱,都需要套上一层外部的标签体系。事件的标签,对于具体业务的应用,都需要根据具体业务需求制定相应的标签分类树。



版权声明:本文为lhy2014原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。