Nuance

更新时间:2022-03-15 09:07

Nuance公司(Nuance Communications, Inc. (NASDAQ: NUAN)) 是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。

公司信息

公司简介

Scansoft完成对Nuance的合并后,于2005年10月18日宣布正式更名为Nuance Communications,Inc。新公司仅在家庭图像应用领域继续延用Scansoft的名称。Nuance是著名的语音和图像解决方案提供商,解决方案包括拨打查号服务、查询账户信息,医疗诊断记录听写、制作能够共享和检索的数字文档等工作。

Nuance公司(Nuance Communications, Inc. (NASDAQ: NUAN)) 是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。

目前世界上最先进的电脑语音识别软件Naturally Speaking就出自于Nuance公司。用户对着麦克风说话,屏幕上就会显示出说话的内容。T9智能文字输入法作为旗舰产品,最大优势支持超过70种语言,超过30亿部移动设备内置T9输入法。已成为业内认同的标准输入法,被众多OEM厂商内置,包括诺基亚、索爱、三星、LG、夏普、海尔、华为等等。

T9全球市场占有率超70%,中国超50%。 自电脑问世以来,科学家们就一直致力于让电脑能够理解人们的讲话。几年前,除了实验室内的演示之外,这方面还没有什么进展。不过2010年来电脑的语音识别功能已经有了质的飞跃,随着语音识别技术慢慢走向成熟,驾驶员可以“告诉”全球定位系统(GPS)他们的目的地;手机用户不必按键,只需要对着手机发布命令即可;医生可以口述患者的病历,而旁边的设备就能自动记录下来,这一切通过口头指令来控制操作的应用已经不仅仅出现在科幻小说中了,而是真正成为了现实。

Nuance的产品提供人性化、高效率的电话口语或语言辨识功能,消费者可透过传统的电话系统或行动电话以自然口语交谈的方式完成资料查询及商业贸易,使用轻松。在类似的产品中拥有最高的语音辨识率,英文可达99%。其英文语音产品Dragon NaturallySpeaking9在法律和医院临床记录占据很大市场。

特色产品

Nuance Verifier提供声纹比对的功能,与Speech Recognition结合可提供更安全的语音商务服务,其所提供的声纹比对的精确度较使用指纹辨识验证还高。

产品与服务

语音识别技术ASR

要想了解Nuance公司的核心技术,首先就要知道什么是语音识别技术。语音识别技术即Automatic Speech Recognition(简称ASR),是指将人说话的语音信号转换为可被计算机程序所识别的信息,从而识别说话人的语音指令及文字内容的技术。用户可以通过ASR利用口述指令来完成对服务终端的控制。

语言识别软件是利用非常复杂的统计方法将人们的讲话与单词对应起来。通过Nuance系统可以开发自然语言理解系统,它以句子为输入,并且返回句子意义的解释性表达。应用程序可以根据用户的请求采取相应的动作。系统也提供基于档次的置信评分,它能更加接近地判别可能准确(或不准确)识别的短语各部分,然后可更加自然和有效地修改应用程序,处理错误检查或重新提示。

声纹鉴别技术

在以ASR技术为基础的情况下,Nuance公司又实现了声纹鉴别技术,该技术属于“生物因子”认证范畴。同指纹一样,声纹同样是不可复制的,每个人的指纹都是唯一的,数百万人之间才会发现有两个人有相同的指纹;与此类似,声纹也是人的个性特征,很难找到两个声纹完全一样的人。说话人识别,也称声纹鉴别,就是根据人的声音特征,鉴别出某段语音是谁说的。

NVP平台

Nuance Voice Platform (NVP)是Nuance公司推出的语音互联网平台。Nuance公司的NVP平台由三个功能块组成:Nuance Conversation Server对话服务器,Nuance Application Environment (NAE)应用环境及Nuance Management Station管理站。

Nuance Conversation Server对话服务器包括了与Nuance语音识别模块集成在一起的VoiceXML解释器,文语转换器(TTS)以及声纹鉴别软件。NAE应用环境包括绘图式的开发工具,使得语音应用的设计变得和应用框架的设计一样便利。Nuance Management Station管理站提供了非常强大的系统管理和分析能力,它们是为了满足语音服务的独特需要而设计的。

公司发展

发展史

过去,Nuance公司的股价曾创出18.85美元的历史新高,尽管其间出现了回潮,许多投资者预计Nuance公司的股价将会继续上涨。纽约投资机构J&W Seligman & Co.的董事总经理Michael Alpert表示,Nuance公司在7月10日的收盘价16.45美元依然偏低,他表示,“他们的策略是围绕着在市场上的主导地位制定的,我认为其收益预期过低。”据悉,J&W管理着200亿美元资金,持有960000股Nuance公司的股票。

据透露,Nuance公司同目录服务公司达成了更多的交易,可以从中获得经常性收入,而不是一次性款项。这些客户包括美国电话电报公司(AT&T),Sprint Nextel Corp.和Jingle Networks Inc.。另外,Nuance公司还与LG电子、诺基亚、摩托罗拉和福特汽车等公司签有协议,其中手机公司生产的每部采用其软件的手机都需支付0.2美元的使用费,而采用Nuance语音识别导航的每部车载装置需支付3-5美元的使用费。Nuance公司声称,2013年约有1亿部智能手机、车载导航系统等装置采用Nuance的软件,而2014年预计将达到2.5亿部。

语言识别技术已经被广泛应用于呼叫中心领域,大部分的电脑查询服务都会采用Nuance公司的ASR技术,该技术用来处理客户的各种需求,无需人工服务从而节约了人力资源。另外,许多相对比较复杂的销售工作也开始使用ASR技术。例如,用户只需向航空公司的电脑服务终端发出口头指令就可以购买或者查询机票。此外,出游预定、股票交易,以及与其他通讯媒体、企业和互联网系统进行交往等活动都有着ASR技术的身影在闪现,可以说,ASR技术越来越广泛地应用于商业之中。

据相关人士预测,语音识别技术还将被应用于网络搜索,将来用户只需一个口令,就可以在Google和Yahoo上得到电脑的自动回复。另外,已经研制出了自动翻译外语的软件,该软件通过ASR记录下说话者的话,然后通过翻译软件将外语翻译成英语。我们可以看到,ASR技术有着广阔的应用范围,而基于此技术的应用软件还在不断地开发与研制中,也许就在不远的将来,实用化将离我们越来越近。

2021年6月4日,微软斥资160亿美元收购Nuance的交易已经获得了美国的反垄断批准。

2022年3月,微软以197亿美元(约 1248.98 亿元人民币)完成收购语音技术公司 Nuance Communications。

国际情况

世界语音技术市场,有超过8%的语音识别是采用Nuance识别引擎技术,其名下有超过1000个专利技术,公司研发的语音产品可以支持超过50种语言,在全球拥有超过20亿用户。在金融领域,超过500家客户;电信行业,前15大公司有超过10家为Nuance用户。语音识别应用领域广泛,如呼叫客服中心、GPS语音定位搜索、电子词典发音,说话译成不同语言的文字。

国内情况

08年3月,亿讯成为大中华区的专业总代理。在中国有9%的语音识别应用是采用Nuance的核心技术。在中国,占据大部分客服呼叫中心的份额,尤其在电信、金融行业广泛应用。和电信、移动、联通、网通都有合作,cctv春晚的呼叫中心也应用此技术。

重点关注产品

桌面产品包括Dragon NatuallySpeaking 10,PDF Converter Professional 5,OmniPage 16,PaperPort 11。

中国市场D 10没出,只是D9版本,价格1880元。对电脑讲话,文字可以出现在基于windows所有应用里。可以创建语音命令,电脑完成多步操作。英文版准确率99%,用口述方式写电子邮件,法律医疗用途广。

PDF 5,单价1100元。唯一一个为商业用户专门设计的解决方案,可以传输任何创建、转换和编辑的PDF文件,保存在线PDF文档,安全创建比同类PDF产品快300%,转换准确度高。

O 16 价格4700元。最精确的OCR软件(光学字符识别),迅速把办公文件和表格转换到30多种不同的PC电脑应用里进行编辑、检索、共享。把文本转成有声书,文件解决方案无缝集成,唯一支持Microsoft office 2007本地格式的OCR应用。

PP 11已出,国内只看到PP 9简体中文版,价格1880元。识别写在纸上的文字信息,并将文字扫描成可编辑、复制、粘贴的文本文档,或直接扫描为新的文字处理文件,目前最精确的PaperPort 软件。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}