国内那几家语音听写技术做的比较好?

  • Post author:
  • Post category:其他


语音听写,是指将短音频(≤60秒)精准识别成文字,实时返回结果,达到边说边返回的效果。

除了要考虑本身语音听写模型或算法的识别准确率之外,一些智能硬件的产品还需要额外考虑降噪、回声消除、去混响等因素,这些都是保证最后识别效果的重要因素。因为涉及软硬件,对能力交付方的项目经验提出了较高的要求。

目前,国内提供语音听写技术的厂商主要有:

1、科大讯飞

成立于1999年,2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际评测中取得佳绩。

在语音听写上,除中文普通话和英文外,支持51个语种、24种方言和1个民族语言,可提供公有云接口及私有化部署方案。采用行业先进的语音识别技术,识别率可达98% 。目前广泛应用于语音搜索、聊天输入、游戏娱乐、人机交互等场景。

2、百度

该技术主要由百度智能云提供,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。近场中文普通话识别准确率达98%,在语言支持上覆盖主流的普通话、口音普通话、粤语、四川话、英语。

3、云知声

2012年6月创立于北京,是国内头部人工智能独角兽企业。语音听写主要应用于语音搜索、语音输入、语音控制等场景。准确率可达实用标准,支持普通话、四川话、粤语、英语的识别。

4、思必驰

07年创立于英国剑桥,08年回国落户苏州,12年完成A轮融资,是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术。语音识别提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。云端连续实时语音识别率>97%,可提供公有云接口及私有化部署方案。

关注我,持续了解更多干货。如需了解语音听写的更多行业和技术信息,可加笔者V:HolaAI,详细交流~



版权声明:本文为HolaAI原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。