现在的位置: 首页 > 综合 > 正文

用声音控制一切:Siri背后公司Nuance的终极梦想

2013年03月25日 ⁄ 综合 ⁄ 共 1739字 ⁄ 字号 评论关闭

直到现在,还有许多人认为对着计算机说话、让其按照你的指令去完成任务是一件很科幻的事情,但有这么一家公司相信通过声音可以控制一切——越来越多的人与他们的智能手机交谈,用语音发邮件,短信,导航,查找信息。现在,语音控制系统已经在智能手机、电视,汽车上发挥它的魅力。

 

“语音和自然语义理解突然成为一门前沿科技,而我们正站在这个过渡点上。我认为语音识别将真正颠覆目前的计算机交互接口”。位于马萨诸塞州柏林顿的Nuance 通讯公司的CTO Vlad Sejnoha 如是说。关于Nuance我们并不陌生,Siri使用的就是Nuance的技术,在此之前曾传言苹果将收购这家语音识别公司,该公司开发了Dragon等产品,统治了语音识别市场。

移动设备变得越来越强大,这也是语音接口更加有用,更加普遍的重要原因之一。语音识别技术的发展也可以用”一日千里“来形容,随着机器学习,统计数据采集技术等机器理解人类语音所需技术的稳健发展,精细的语音技术已经应用于客户服务中心,可以让用户进行菜单导航,或者帮助识别是否可以挂断粗鲁的客户。

Jim Glass ,一位从80年代就已经从事语音接口的研究的MIT高级研究员认为,现今的智能手机的语音识别功能已经与他在90年代做出的机器一样强大。智能手机同时从云端获取高带宽数据,可以让服务器来做包括语音识别和语义理解等高负荷工作。“更多数据与更强大的计算机结合意味着更精密的统计模型。”

移动语音接口最突出的例子莫过于个人语音助理Siri,最新一代的iPhone已经配备了这一功能,调戏Siri也成为了风靡一时的游戏。此外,在Android,Windows
Phone等其他手机平台上已经出现了一些配备语音功能的应用。然而这些接口还存在很大限制,必须要靠近机器接口才能与手机交谈。

Nuance 创建于1992年,已经获得大量的语音技术业务,近些年,Nuance将他们的语音识别技术熟练的应用于新兴的语音接口市场。现在在世界35个地区拥有6000名员工,2012年第二季度的收入已经达到3.903亿美元,相比2011年同一时期增长了22.4%。

语音识别会如何改变移动互联网?Nuance的CTO Vlad Sejnoha称,语音识别非常适合移动计算,用户的手和眼睛已经被其他事物占据,而且单个语音命令就可以完成平常需要许多点击按键才能完成的工作。目前语音识别软件在智能手机上已经获得成功,而Nuance 希望能更进一步,将他们的语言接口应用到更多地方,尤其是电视、汽车。

在电视上使用语音操作的好处是让用户可以从手动操作中解放出来,全身心的投入到娱乐中。在Nuance的研究实验室,Sejnoha 在电视机上演示了称作Dragon TV的软件。只需说一句“Dragon TV,找梅丽尔.斯特里普主演的电影”——语音接口立刻通过频道节目单找到了合适的电影。这一技术的一个版本已经出现在三星出售的电视上。另一条消息是,最近很多传言Apple 要开发自己的电视产品,并推测会用Siri做控制。在Walter Isaacson的乔布斯传中,这位已故的CEO宣传已经解决了Apple TV的设计问题。

同时,Nuance的技术也用在福特公司的同步娱乐系统上用于汽车导航,天气信息,和音乐。目前已经有4百万两配备语音识别的汽车进入市场。上周,Nuance 发布了称作Dragon Drive的软件,允许汽车制造商自己为汽车添加一些语音控制特性。

为更好地推广语音识别技术,Nuance开发了一系列地软件开发套件允许任何开发商将语音识别技术纳入他们的应用中。Montrue 科技是一家位于俄勒冈州Ashland的公司,他们使用Nuance的移动医疗SDK开发iPad 应用,允许医生们口述记录诊断内容。

“它精确地不可思议,”Montrue地CEO和联合创始人、急诊医生Brain Phelps说道。

语音识别的未来应该不仅仅如此。可能未来有一天,人们甚至会与他们的穿戴式计算机对话——例如说Google 开发的智能眼镜Project Glass。或许这一天并不遥远,Nuance就表示,他们将积极计划如何将语音技术运用在穿戴式计算设备上。

Via TechnologyReview


 供雷锋网专稿,转载请注明!)

抱歉!评论已关闭.