句子是基本的语义单元,电子图书是句子集合,使用子现代人工智能神经网络技术来研究电子图书,必须对其中的句子进行统计分析,寻找其间的关联,建立索引。
比如,在《邓选》合订本里面包含”改革,开放“的句子有多少?这些句子的时间分布如何?最早出现”改革、开放“的句子是在哪一年?其后,又是怎样逐年演变的?由此,可以对邓小平完整的思想理论体系进行深入的分析与研究。
《邓选》合订本里面有多少个汉字?多少个标点符号?分布是怎样的?这种分布信息怎样用最小尺寸的文件记录下来?《邓选》合订本里面有2万多个句子,使用一般的逐次匹配的算法,全书扫描达到秒级的检索速度几乎是不可能的事情。唯一有效的办法是建立全文检索系统(基于句子),这就是《邓选》电子版快速检索的秘密。
1994年11月11日,《光明日报》头版刊出文章”电子版《邓小平文选》已有合订本”,其中写到:《邓选》电子版也为深入学习和研究建设有中国特色社会主义理论和邓小平完整的思想体系提供了一个全新的工具。
这种评论是实事求是的,不为过份。应该说,火星人研制开发《邓选》电子版是为全国人民做了一件好事。有人说,《邓选》电子版是DOS版本,现在用不上了。不对。1995年,微软发布Win95操作系统之后,《邓选》电子版的升级工作已经在进行中,但是,后来没有公开发行。今年8月22日,在邓小平诞辰110周年时,本想推出《邓选》网络版,由于某种客观原因未能实现。
发行《邓小平文选》电子版的实际影响是巨大的,有何为证?且听下回分解。