to do what?
本文主要利用实体类型的一致性来预测事件类型, 事件成员(参与者)和成员角色。依赖于以下3个现象:
1. 相同类型的实体往往参与相似事件,这些事件经常使用一致或相似的触发词。
2. 在相同类型的事件中,相同类型的实体正常与相似的参与者共同出现。
3. 相同类型的成员在相似事件中扮演相同的角色。
how to do?
我们以下列步骤执行一步一步地推理:
第1步: 预测事件类型,并且标记给予相同类型实体的触发词。
第2步: 通过由第1步给出的先验实体类型、事件类型和触发词在某个事件中来识别成员。
第3步: 通过由第2步给出的实体类型、事件类型、触发词和成员在某个事件中来确定成员角色。
以下是跨实体推理的主框架:
训练过程:
是以549篇ACE文本作为训练语料,另外10篇新闻类型文本用于参数调试,还有40篇新闻类型文本用于测试。
A1: 对于每一个实体描述,我们将该描述作为检索50个来自Web做相关文档的查询。然后我们选择50个关键字,用TFIDF确定权重来描述实体背景。对于每一种类型的实体描述,建立空间向量模型(VSM)。
A2: 采用CLUTO聚类工具将实体类型划分为子类型。
A3: 提取以下特征,为基于SVM分类器作准备。
A4: 通过基于SVM分类器来进行argument classifier, role classifier和report event classifier。
测试过程:
T1: 必须是一个句子,并且至少包含一个实体。
T2: 建立实体背景同A1
T3: 通过CLUTO得到的聚类和K-nearest neighbor的方法来确定实体子类型。
T4: 特征提取同A3
T5: 执行一步一步跨实体推理,检测触发词、确定事件类型、成员分类、角色分类、report event分类
what should I do?
- 建立实体背景中使用的信息检索,VSM空间向量模型。
- CLUTO聚类
- 具体特征提取
- 基于SVM的分类器