现在的位置: 首页 > 综合 > 正文

《Using Cross-Entity Inference to Improve Event Extraction》读书笔记

2011年11月29日 ⁄ 综合 ⁄ 共 825字 ⁄ 字号 评论关闭

to do what?

本文主要利用实体类型的一致性来预测事件类型, 事件成员(参与者)和成员角色。依赖于以下3个现象:

  1. 相同类型的实体往往参与相似事件,这些事件经常使用一致或相似的触发词。

  2. 在相同类型的事件中,相同类型的实体正常与相似的参与者共同出现。

  3. 相同类型的成员在相似事件中扮演相同的角色。

 

how to do?

我们以下列步骤执行一步一步地推理:

  第1步: 预测事件类型,并且标记给予相同类型实体的触发词。

  第2步: 通过由第1步给出的先验实体类型、事件类型和触发词在某个事件中来识别成员。

  第3步: 通过由第2步给出的实体类型、事件类型、触发词和成员在某个事件中来确定成员角色。

 

      以下是跨实体推理的主框架:

     

训练过程:  

  是以549篇ACE文本作为训练语料,另外10篇新闻类型文本用于参数调试,还有40篇新闻类型文本用于测试。

  A1: 对于每一个实体描述,我们将该描述作为检索50个来自Web做相关文档的查询。然后我们选择50个关键字,用TFIDF确定权重来描述实体背景。对于每一种类型的实体描述,建立空间向量模型(VSM)。

  A2: 采用CLUTO聚类工具将实体类型划分为子类型。

  A3: 提取以下特征,为基于SVM分类器作准备。

  

  A4: 通过基于SVM分类器来进行argument classifier, role classifier和report event classifier。

 

测试过程:

  T1: 必须是一个句子,并且至少包含一个实体。

  T2: 建立实体背景同A1

  T3: 通过CLUTO得到的聚类和K-nearest neighbor的方法来确定实体子类型。

  T4: 特征提取同A3

  T5: 执行一步一步跨实体推理,检测触发词、确定事件类型、成员分类、角色分类、report event分类

 

what should I do?

  1. 建立实体背景中使用的信息检索,VSM空间向量模型。
  2. CLUTO聚类
  3. 具体特征提取
  4. 基于SVM的分类器

抱歉!评论已关闭.