现在的位置: 首页 > 综合 > 正文

第3章 事实、数据检索

2012年12月23日 ⁄ 综合 ⁄ 共 7882字 ⁄ 字号 评论关闭
3章 事实、数据检索
3.1 概述
3.2 字典、词典
3.3 百科全书
3.4 名录
3.5 年鉴
附录
3.1 概述
事实和数据是信息检索的重要内容。文献检索是根据
某一课题,查询检索工具查找到文献线索的检索活
动;而事实和数据检索则需要查询出信息本身,是一
种确定性的检索。事实、数据检索在人们从事生产、
学习、科学实验、其他日常工作或各项经济活动中都
会碰到这种检索需要。比如说,某个英文缩写或代码
表示什么含义,某个计量单位的换算,某型号的电子
器件有多少厂家生产及其技术特性数据如何,我国电
气电子类产品的生产、市场、消费以及与各国或地区
之间的进出口贸易关系怎样,这些都是具体的数据和
事实问题。
事实和数据检索,主要靠参考工具书(Reference
Books)来解决。参考工具书是汇集某一范围的知识文
献信息,并按一定的方法编排,供人们检索有关事实
性和数据性的检索工具。包括各种字典、辞典、百科
全书、年鉴、手册、组织机构指南、名录等。参考工
具书收集的内容广泛完整、并有一定的编排方式组
织,读者可以根据自己的需要选择参考工具书并可以
根据音序、形序、分类、主题、关键词等途径检索到
有关信息。本章主要介绍各类参考工具书的内容、使
用方法,使得读者能准确迅速地使用参考工具书进行
事实和数据检索。
3.2 字典、词典
字典和词典是收录字、词的出版物,其
内容在于注释字、词、科技名词术语、
缩略语的形、音、义、全称、用法、不
同文种的对译等。科技类的词典,主要
是学科名词术语或定义的解释或不同文
种互译对照。一般说来,凡解释词语多
用词典,如《现代汉语词典》;解释字、
词的概念与用法多用字典,如《新华字
典》。
字典词典一般包括正文、辅助说明、目
录索引和相关说明组成。字典、词典的
正文一般按音序字母或字顺排列;辅助
说明可以了解该字典、词典的编制目的、
使用对象、取材范围、编排方法;目录
索引主要是方便查检;字典、词典后面
附的参考资料对事实、数据检索很有参
考价值。
3.2.1 印刷型字典、词典介绍
1.现代汉语词典.(中国社会科学院语言研究所词典编辑
室编;晁继周等修订.5版.北京:商务印书馆,2005
《现代汉语词典》是一部以记录普通话词语为主的中型
词典,可供中等以上文化程度的读者使用,该词典以推广
普通话、促进汉语规范化为宗旨。
5版收词6.5万条,增加6000余条新词,删减旧词
2000条。新增词条中,收录了德治、反恐、和谐社会、
跑官、扫黄、双规、以人为本、丑星、出场费、动漫、个
唱、做秀、偶像剧、星探等新词,但在网络上十分流行的
网络语言在《现代汉语词典》第5版中却都没有收录。
该词典由凡例、音节表、新旧字形对照表、部首检字表、
四角号码检字表、词典正文以及附录七部分组成。正文中
的词条由词目、注音、词条释义以及例词例句四部分构成。
2.辞海:(普及本.辞海编辑委员会[编纂].上海:上海辞书出版社,
1999.3册)
《辞海》是一部以字带词,兼有字典、语文词典和百科全书功能的
大型的综合性的辞典。辞海采用以字带词的体例,因而又兼具字典、词
典功能。旧《辞海》从1915年由中华书局开始策划,1936年成书出版。
1936-1999年《辞海》先后出版多种版本。1963年版的《辞海》收录
单字13587个,选收词目84336条; 1979年版选收单字增至14872个,
词目增至91706个;1989年版分上、中、下三册。1999年版:有多个版
别,新增彩图本和音序本,并于2003年推出了珍藏本系列。主编为夏征
农。所有版本的文字内容一致,区别在于图片配置和词条编排上:彩图
本用彩色图片,其他使用黑白单线白描图;音序本在《辞海》历史上首
次按照拼音音序来编排词条正文。
1999年版《辞海》收录单字19485个(含繁体字和异体字),其中
17674个列为字头。字头及独立词目122835条;全书篇幅为1983万字。
3.辞源
《辞源》是我国第一部大规模的语文词书。它始编于
1908(清光绪三十四年)1915年以甲乙丙丁戊五处版
式出版。1931年出版《辞源》续编。1939年出版《辞源》
简编,历时数十载,几经修订,至1983年才完全大功告
成。它凝聚了几代学者的心血,包含着全国数省几万人
的辛勤劳动。工程浩繁,来之不易。除大量的字词释义
外,对于艺文、故事、典章、制度、人名、地名、书名
以及天文星象、医术技术、花鸟虫鱼等也兼收并蓄。融
词汇、百科于一炉,既体现了工具性和知识性,有兼顾
了可读性。
4.新牛津英语词典(上海:上海外语教育出版社,1998
词典为1998年新版,系当今世界最权威、最值得信赖、收词最
全面的新型工具书。与以往的同类词典比较,本词典遵从当代英语
的实际,采用描写原则,精简义项,体现实用性;释文力求简炼,
措辞力求简易,科技术语解释通俗易懂,另加拉丁学名、化学分子
式。 35万词条,7万余个例证,1700万字的篇幅,堪称世界上规模
最大的单卷本词典; 2000余条新词新义,5.2万条科技词汇,1.2
个百科词条,充分展示20世纪90年代的新科技、新工艺、新产品、
新学科的进步;撷取1.1万条北美、澳新、印度、加勒比等地区的英
语词目,体现了真正意义上的国际词典;创造性的释义排列,提供
详细的语法信息和词的搭配信息,配有500处用法详解,一目了然,
便于模仿和学习;采用开放型版式,多分段,尽量少用括弧,以小
黑方格、小黑三角、小黑圆点为主要分隔标志,醒目而又方便。
3.2.2 在线字典、词典
1.在线汉典
在线汉典(http://www.zdic.net/)建于2004
年,建站的宗旨是为了宏扬中华文化,继承优良
传统,推广学习汉语,规范汉字使用,为广大网
民提供便利。在线汉典提供汉字字音自义的检
索,功能类似于《新华字典》,检索方式分拼音
索引部首检字两种入口,检索方式基本与
《新华字典》相同。
拼音索引
部首检字
2.中华在线词典
中华在线词典(http://www.ourdict.cn/
20055月发布。目前共收录了12部词典
中的汉字15702个,词语36万个(常用词语
28770),成语31922个,近义词4322个,反
义词7691个,歇后语14000个,谜语28071
个,名言警句19424
3.在线翻译中心
在线翻译中心(http://sh.dict.cn)由在美国印第安
纳大学的中国留学生创建,正式使用于20031127日。
本词典的最初词条数据为从小学到初中、高中、大学以
GRETOEFL的考试资料和网页中索引抽取得到的词汇
和解释。并采集了大量各行各业的专业英语网络资料和
英汉人工翻译双语材料,并做了大量程序分析整理(包括
使用中文分词,词频统计,英中中英相互关联词义生
成,解释由程序利用自定义参数优化等)。部分词条由人
工进行释义(包括对程序生成的解释修改)而成。
该词典充分考虑了用户的使用习惯,在单词的纠错、
智能查询等功能上都优于其他词典,列举如下:
1)拼写纠错,用户单词查询时拼写不正确,系统可以自动
纠正,反馈给用户正确的单词释义。例如输入不正确拼写:
techology 能自动猜测出 technology
2)知音查词,如果用户知道单词的发音却不知道单词的拼
写,可以使用已知条件——发音来查找具体的拼写和解释。
发音搜索时不需要输入确切的音标,只要随意输入一个理论
上发音接近的单词即可。(查询时请在搜索单词两端加中括
号以示区别,如:[prunounse])比如搜索发音:[finix]
匹配单词 phoenix
3)变形识别,能自动识别单复数、时态及名动形的相关
性,未直接命中时会智能建议相关词条,如:dictionaries
给出dictionary;如:searched 会给出 searchsearcher
4)中文分词,输入太长的词语未命中时自动切分如查询:
个词典支持模糊匹配查询会切分出这个,词典,支持,模糊,
匹配,查询。
5)短字补全,输入不完整的词语而未命中时自动补全。如查
五花没找到时会推荐出带"五花"的词条如五花八门等。
6)近似匹配,输入短语未命中时自动计算出相似度最高的候
选词语,如查询:a lots of没找到时会推荐出lots ofa lot ofa
lot;又如:菜花黄没找到时会推荐出菜花耳,菜花头红花
花黄素
7)拼音查询,可以直接使用汉语拼音进行查词,查询时可在
字母后面加数字作为音调(1阴平、2阳平、3上声、4去声、5
音、0任意),如输入拼音:ci dian ci2 dian3
8)辅助翻译,全面支持长句子和短语的辅助翻译。
如果你要翻译句子吃过晚饭了吗?,一般数据库不可
能收录所有完全匹配的词条,此时系统会给出数据库
中的以下句子:你吃过晚饭了吗?吃过午饭了
吗?等类似条目,这些句子与原句非常相似,用户可
以参考他们的翻译来获得原句的解释。
9)自动发声,约2.5万常用单词带有声音。当你看
到一个喇叭图标时,移动鼠标到上面会自动发声。
10)历史学习,点击查看历史可以看到自己过去查
询过的单词(不包括非命中词条)。这些单词是你还记得
不清楚的单词,通过查看历史可以作强化记忆,也可
以导出一个文本文件保存到本地,以便日后学习。
11)图片实例,查询一个单词后如果想进一
步看到形象化的图片实例,可以点击<查看图
>
12)编辑解释,如果你对数据库中某个词条
的解释不满意,或者发现某个单词的发音或例
句有错误,系统会允许你<编辑解释>,自己
动手修改这个单词的解释和音标等。
13)新词添加,查询单词时,如果数据库中
没有该词,系统会允许你<添加新词>。点了<
添加新词>连接后就可以自己动手创建这个单
词或短语。
较常用的在线词典还有:
TigerNT http://www.tigernt.com/
含汉英字典、英汉字典、TOEFLGRE 考试词汇、
及网上工具链接。
网路英英/英汉辞典 http://www.onlinedict.com/
颜元叔教授主编
AmosWEB ECONOMIC GLOSS*arama
http://www.amosweb.com/gls/
该在线词典收录一千多个经济名词解释。
洪恩在线 http://study.hongen.com/dict/
3.3 百科全书
百科全书的英文名称是Encyclopedia,来源于希腊文,约有2000
年的编纂历史了。目前全世界出版的大型综合性的百科全书已有
200多种。百科全书是人类知识的总汇,是记录人类知识最全面、
最系统大型工具书。它囊括了人类一切知识的基本资料,对每一
学科提供了定义、原理、方法、历史及参考书目等方面的资料,
被人们称为工具书之王。百科全书以其释疑解惑的工具书功能
以及全面系统地提供知识的教育功能,我们可以利用百科全书查
阅各学科的概述、专名、术语、世界各国的人物、历史、地理、
团体、机构等等,成为人们求学的无墙大学精细图书馆
百科全书是典型的三次文献,它由各学科的众多专家撰稿。它的
内容注重全、精、新,百科全书收录的知识领域完整、信息充
足,数据事实精确可靠、编辑出版权威、资料相对新颖。百科全
书内容在相对稳定的基础上不断更新,反映出时代特色。
1.百科全书的类型
百科全书按照不同的标准可分为多种类型。
1)百科全书按照内容范围可分为综合性百科全书和专科性百
科全书。综合性百科全书收录的内容广泛、内容覆盖了人类知识
的各个方面,比如《大不列颠百科全书》、《中国大百科全书》
等;专科性百科全书收录的内容专属于某一学科或某一领域,比
如《中国武术百科全书》。
2)按照地域分,可分为国际、国家与区域性百科全书。国际
性百科全书收录了包括全世界各个国家、各个地区的主要知识;
国家性百科全书反映的是某一国家的基本情况;而区域性百科全
书则反映某一地区的基本情况。
此外,还可以按百科全书的读者对象分,分为少年儿童百科全书、
大学生百科全书、其他读者百科全书。
2.百科全书的编排
百科全书收录的各种学科体系内容多以条目的形式列
举,其编排方式有以下几种:
1)按字顺编排。这种编排以小条目字顺为序,类似
字典的编排,方便读者快速查找。《简明不列颠百科全
书》属于这种编排方式。
2)按学科的分类体系编排。这种编排以学科分类的
大条目为序,每个条目以专题论文的形式系统全面地介
绍这一条目的相关内容。这类百科全书常有分析索引进
一步揭示大条目中包含的具体内容,以方便读者的查找
使用。
3)分类、字顺混合编排。这类百科全书大类按分类
编排、小条目按字顺编排。《中国大百科全书》就是按
这种混合编排方法编排的。
3.3.1 综合性百科全书及其检索
1.《中国大百科全书》(中国大百科全书出版社编辑部编. 北京:中
国大百科全书出版社, 1980-1994
《中国大百科全书》是一部提供古今中外各学科、各领域一般知识的、
具有权威性的大型综合性百科全书。由全国各学科的权威人士担任主
编,2万余名著名学者、专家撰稿。该书从1980年起由中国大百科全书
出版社陆续出版,已于1993年出齐,共74册,是世界上规模最大的百
科全书之一。
中国大百科全
书条目正文
前言
凡例
分类目录
索引
附表
中国大百科全书.简明版.北京:中国大百科全书出版社,1996. 12
该书出版于1996年,全书12卷,第12卷为索引卷。该书收录了
3.1万个条目,随文附有1.1万幅插图和表格。《中国大百科全书.
简明版》坚持《中国大百科全书》的编辑方针,它的知识体系
以《中国大百科全书》为基础,删除了《中国大百科全书》各卷
中的重复、较差、过专、过僻的条目,归并了散见在各卷中从不
同角度阐述的、属于同一主体的条目,增补了《中国大百科全书》
欠缺的知识总论、国家、能源、材料、信息、旅游、民俗以及服
饰、烹饪、家政等方面的条目,补入了《中国大百科全书》问世
后出现的新知识,更新了《中国大百科全书》的资料和数据。
该书正文中的条目按音序音形法组织。每一条目通常由条目标题、
条目标题原文、释文组成。正文中条目的版面区域分为:
b d f
a c e
百科全书的网络版(http://www.ecph.com.cn)。目前还处在测
试阶段,给注册用户提供免费的检索结果。用户可以从标题、条
目卷、条目作者、条目英文、正文内容以及这些字段的
的组合进行检索。
2.《不列颠百科全书》(Encyclopedia Britannic
《不列颠百科全书》创编于1768年,1771年在苏格兰的爱丁堡
首次出版。《不列颠百科全书》是当代世界上声誉最高、最有权威
性的大型综合性百科全书之一,为著名英语三大百科全书ABC
中之B。其撰稿人包括科学巨匠爱因斯坦、弗洛伊德、语言学家门
肯等。该书原由英国不列颠百科全书出版社出版,自第12版开始,
版权全部转入美国的芝加哥大学手里,现由位于美国芝加哥的
Encyclopaedia Britanniaca Inc出版。
《不列颠百科全书》的结构自1974的第15版起开始稳定,15
《大不列颠百科全书》共30卷,1985年增至32卷,增加了索引2卷。
《不列颠百科全书》由《百科类目》、《百科简编》、《百科详编》
及《索引》组成。
百科简编百科详编
百科类目
索引
3.《美国百科全书》(Enclyclopedia American
《美国百科全书》(简称EA)1829-1833年问世,由美国四大百科出版商之一
Grolier公司出版,到现在已有170多年历史。初版13卷,实际上是从德国著名的
布洛克豪斯《社交辞典》第7版中的条目翻译编纂而成。它是美国出版的第一部
大型综合性百科全书。在英语百科中,论其内容的权威性仅次于《不列颠百
科》,为著名英语三大百科全书ABC中之AEA经多次修订,1918-1920
间,在编辑赖纳斯(G.E.Rines)的主持下,进行了较大的增补,扩充到目前的
30卷。这部巨著的数万个条目旨在成为专家和一般读者之间的桥梁(见EA
序),即要求撰写者是所属某学科的权威,力争做到深入浅出。EA对美国、加拿
大的历史、地理知识介绍得尤为广泛和深入。传记内容占全书的40%,有许多文
学名著和著名歌剧的梗概。从1923年起,每年出版一卷,作为全书补编。其条目
逐词排列。插图22865幅,其中16%是彩色的。索引达35.4万条。内容范围偏重
历史、地理和传记,约40%的条目是传记,20%是地理。收有许多在其它百科中
找不到的美国古今人物。对一些具有历史意义的文献,如奴隶解放宣言华盛
顿告别辞等全文刊载。
每一世纪都是独立成篇的大条目。在各个世纪的词条内、从国际
范围和各个学科领域的发展来叙述某一历史断面,给读者提供全面
的背景资料,这一点是EA的独到之处。
EA采用中小条目编纂法。条目平均长度550词。但也有大条目,
中国__________长达100页,第二次世界大战170页。每一大条目之首均
有内容提要。全部条目按逐字排列法编排,如果标目完全一样,再
按人--事物排列,如:
Bell, Alexander Graham (人名)
Bell (城市名)
Bell ()
条目后附有注音,释文后附有书目。注重专门术语和词汇的解释。
索引是分析索引(内容索引)和条目篇名索引的结合,约35万条,
用大小写的黑体字分别代表篇目名称和隐含主题。索引条目中均标
明插图(illus.)、地图(map)和术语(Glossaries)在全书的出处。
4.《科利尔百科全书》(Colliers Encyclopedia
《科利尔百科全书》(Colliers Encyclopedia)简称
EC,为著名英语三大百科全书(美国百科全书、不列颠
百科全书、科利尔百科全书)ABC中之C。本书是适合于
非专业人员、青年学生、家庭使用和阅读的百科全书,
条目设计针对学校的课程,在物理学、生命科学、地学、
社会科学和人文科学方面提供了丰富的资料,但深度和
广度不如EBEAEC注重事实,理论性阐述较少。
3.3.2 专科性百科全书及其检索
1.《中国海关百科全书》(叶松年等编.北京:中国大
百科全书出版社,2004
《中国海关百科全书》约291万字,2550条条目,配
彩色插图和随文图533幅,参加编纂人数达600多人 ,是
现代大型海关知识工具书,由中国大百科全书出版社与
中华人民共和国海关总署合作编纂出版的。
在此之前,无论是中国,还是世界其他国家,都没有
关于海关专业的百科全书。《中国海关百科全书》的出
版,无疑填补了这一空白。本书第一次全面、系统地概
述了中国海关的历史,海关专业的基本概念、基本知识
和基本情况,以及国内外的相关知识,突出地反映了中
国改革开放以来海关战线取得的巨大成就,是一部海关
历史与现实相结合、理论与实务相结合的工具书。
2.《质量标准化计量百科全书》(王渝丽,梁丽华.北京:中国大
百科全书出版社,2001
该书汇集了古今中外质量、标准化、计量三个学科或门类的已有
全部知识,进而首次提出了这三个学科或门类的知识体系。全书富
有知识性、系统性;它紧密结合当前的质量管理、质量监督、合格
评定和标准化、计量工作以及锅炉、压力容器、管道、特种设备的
质量监督和安全监督,坚持理论与实践相结合的原则,第一次全面
系统地对大量的实际工作进行了理论总结,用以指导实际工作,全
书具有很强的实用性;它吸纳了质量、标准化、计量工作中大量超
前性研究成果,全书具有很好的前瞻性;它前有条目分类目录,正
文按汉字拼音排序,后面还有条目汉字笔画

抱歉!评论已关闭.