现在的位置: 首页 > 综合 > 正文

模式集成与语义集成

2013年10月01日 ⁄ 综合 ⁄ 共 1153字 ⁄ 字号 评论关闭

以前对模式集成并没有探究,总是将模式等同与数据库的表定义,或者xml schema。今天想到xml 数据与RDB数据的集成分为两个层次,一个是两种数据存储格式间的映射,然后才是相同语义的不同元素间的映射。

联想到元模型概念,可以这么类比

数据存储格式(xml,RDB,text)                                   元模型

具体应用数据的字段定义,字段含义                        模型

具体数据                                                                         实例

 

对于元模型的模式集成,通过不同数据存储方法的映射,可以提供统一的解决办法。

对于实例层,则是数据集成讨论的问题,需要解决数据语义冲突,数据实例转换

而我们通常讨论的模式集成(schema mapping) 应该是模型层次的集成

模式集成最初提出是为了设计全局模式来支持全局的查询。

它的一个关键问题是模式匹配,一个是查询分解。

匹配:两个或多个模式通过一定算法,找到每个元素语义上最接近的元素的过程

通过匹配过程,找到了一部分元素的对应的关系,但是可能存在语义冲突,比如3个模式,其中一个模式与其他两个模式都找到了对应关系,这里可能会出现,对应的两个模式的数据可能会重复,或者不一致。  还有可能某些元素并没有找到合适的匹配。 所以可能需要人为参与来决定具体的映射关系。
最后将结果表示成映射,用于模式转换。

还有一个词语义集成(semantic integration),同时还有 ontology integration ,及前面的schema mapping,这

三个词需要区分开。

schema mapping的提出主要为了解决关系数据库模式的集成,和xml schema集成中的匹配问题,后来知识库德发展,本体论的发展,很多数据以本体的形式存在,所以在知识库中存在Ontology mapping的问题。
同时,很多人尝试将schema转为为ontology,在ontology领域解决匹配问题。在ontology中可以利用很多语义信息,比如class of,child of 等,来提高匹配准确度。
我们可以看到,所有的匹配都是为了找语义上最相近的元素。所以我认为schema mapping ,ontolgoy mapping都可以看作semantic mapping的具体方法。

匹配的方法主要为两种:1 语言级的匹配技巧 2机器学习

对于大规模schema,或者Ontology进行自动化匹配是十分重要的技术,但是由与它和自然语言理解的本质渊源,所以是不可能全自动化精确匹配的。 但是通过研究提出精确度较好的匹配技术,仍然有很大的实践意义。

对这个方向感兴趣的朋友欢迎讨论!

抱歉!评论已关闭.