现在的位置: 首页 > 综合 > 正文

关于J2ME的英汉字典

2013年10月14日 ⁄ 综合 ⁄ 共 693字 ⁄ 字号 评论关闭

这几天放假,试着写了写英汉字典,刚开始只是实现了英译汉,软件效率还可以,由于受限于手机内存和对Java软件大小的限制,词汇量不是很大。

后来,又试着实现了汉译英,关于汉译英的实现没有使用特定的词典文件,因此在实现汉译英时,尽管词汇量不是很大,由于想实现相对的“模糊查询”,所以效率比较低下,对于高性能的手机速度还说得过去,只是对于低端手机,效率就比较低下了。

今天研究了一下NOKIA的字典程序(英汉互译版),发现所使用的字典文件检索效率比较高,检索效率对于英译汉而言并不能体现,但是对于汉译英而言,效率就体现出来了,具体做法:

英文单词词条以及中文词条,均按英文字母或汉语拼音排序,形成若干个文件,然后再按照对应关系生成字典文件,字典文件的格式大致为: 词条UTF编码、对应解释所在的文件编码、对应解释在文件中的偏移(主要是这三部分)。

这样在进行汉译英时,效率和英译汉差不多;要比使用普通的字典文件效率高的多。这种字典文件格式也有一个缺点,那就是关于"汉译英"问题,只有要查询的词语和中文词条的前面若干个汉字匹配,才算匹配,这样使得查询不够全面,因为一个英文单词可能有几个不太一样的中文解释。更好的办法:在形成中文字典文件时,也采用类似于英文字典的格式,形成"中文--〉英文"的一对一或一对多关系。

但是生成这样的字典文件比较麻烦,当然可以编写程序生成,程序的工作量还是不小。不过,如果借助于数据库来生成词典文件应该能大大减少程序的工作量。后一种方法自典文件的生成就更复杂了,程序的工作量完全在字典文件的形成。

由于我自己对数据库这一方面还不是很精通,因此也就没有做字典文件,以后有时间再说吧。

抱歉!评论已关闭.