关于J2ME的英汉字典

现在的位置: 首页 > 综合 > 正文

关于J2ME的英汉字典

2013年10月14日 ⁄ 综合 ⁄ 共 693字 ⁄ 字号小中大 ⁄ 评论关闭

这几天放假，试着写了写英汉字典，刚开始只是实现了英译汉，软件效率还可以，由于受限于手机内存和对Java软件大小的限制，词汇量不是很大。

后来，又试着实现了汉译英，关于汉译英的实现没有使用特定的词典文件，因此在实现汉译英时，尽管词汇量不是很大，由于想实现相对的“模糊查询”，所以效率比较低下，对于高性能的手机速度还说得过去，只是对于低端手机，效率就比较低下了。

今天研究了一下NOKIA的字典程序（英汉互译版），发现所使用的字典文件检索效率比较高，检索效率对于英译汉而言并不能体现，但是对于汉译英而言，效率就体现出来了，具体做法：

英文单词词条以及中文词条，均按英文字母或汉语拼音排序，形成若干个文件，然后再按照对应关系生成字典文件，字典文件的格式大致为：词条UTF编码、对应解释所在的文件编码、对应解释在文件中的偏移（主要是这三部分）。

这样在进行汉译英时，效率和英译汉差不多；要比使用普通的字典文件效率高的多。这种字典文件格式也有一个缺点，那就是关于"汉译英"问题，只有要查询的词语和中文词条的前面若干个汉字匹配，才算匹配，这样使得查询不够全面，因为一个英文单词可能有几个不太一样的中文解释。更好的办法：在形成中文字典文件时，也采用类似于英文字典的格式，形成"中文--〉英文"的一对一或一对多关系。

但是生成这样的字典文件比较麻烦，当然可以编写程序生成，程序的工作量还是不小。不过，如果借助于数据库来生成词典文件应该能大大减少程序的工作量。后一种方法自典文件的生成就更复杂了，程序的工作量完全在字典文件的形成。

由于我自己对数据库这一方面还不是很精通，因此也就没有做字典文件，以后有时间再说吧。

【上篇】程序员的十层楼（4~5层）
【下篇】Interfacing DJGPP with Assembly-Language Procedures

作者: bumpy

该日志由 bumpy 于11年前发表在综合分类下，最后更新于 2013年10月14日.
转载请注明: 关于J2ME的英汉字典 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

关于J2ME的英汉字典

作者: bumpy

书签

最新文章New

本站推荐

返回首页