现在的位置: 首页 > 综合 > 正文

科大讯飞语音功能小结

2014年06月07日 ⁄ 综合 ⁄ 共 944字 ⁄ 字号 评论关闭

这段时间在做关于语音识别的开发,在网上找了找,现在国内在做语音的有科大讯飞,云知声,捷通华声,紫冬锐意,据说今年12月份中旬,微信的语音接口会向第三方应用提供,很期待啊。。。
对于科大讯飞和云知声我稍作了研究,下面呢说一下科大讯飞吧。


科大讯飞的示例demo比较炕爹,它必须在你申请的appid基础上运行,否则会出错哦!也就是你必须申请appid,然后才能下载示例demo,很炕爹吧!

这里我就不多余重复开发文档中的了,说一些自己的理解:
1.我之前有一个想法,就是科大讯飞在语音识别的时候,需要你上传命令词,词表或者联系人,我们可以在注册开发者的时候在自己的信息中上传自己的词库,然后我们在程序中只需要通过登录来获取一个标示token什么的,这样的话,如果你的词库发生变化了,就不需要更改代码了,只需要在自己的开发者信息下重新上传一下,不用更改程序了,科大讯飞的技术支持的回复是web端没有提供这个接口,他们的回复是:我们可以申请一个web端的appid,然后在自己的服务器上做这样的处理
2. 词表和联系人在上传的时候没有返回grammerID,在语音识别的时候需要登录,上传一次;命令词和abnf语法上传也是上传一次,但是这里会回复一个grammerID这样就需要在语音识别的时候传参。
3.命令词和词表的区别在于:
     命令词:语音识别的时候会只在命令词的范围内搜索
     词表:语音识别优先从词表总搜索
4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional
5.如果想要自定义UI则须参考无UI的demo,然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片
6.grammerID可以跨平台使用 

26/12/2013

今天我进行内容添加,微信语音开放平台也已经对外开放,但是其功能上并没有科大讯飞的强大(到目前为止),而且其识别精确率也只有95%,这里就不做介绍了,都差不多的,链接地址:http://pr.weixin.qq.com/voice/

先到这里,还会续写。。。。。。

科大讯飞开发文档和SDK下载地址:http://open.voicecloud.cn/download.php

抱歉!评论已关闭.