܄

数据猿

脱离现实场景谈准确率的语音识别技术统统都是耍流氓

大数据语音识别阿里云

吾皇 | 2016-12-13 11:21

【数据猿导读】阿里云智能语音技术总监鄢志杰在开发者社区中透露，团队在语音识别声学模型研究上再获重大进展。通过改进的LC-BLSTM模型，使其规模庞大的线上语音识别服务的解码速度提升了3倍，并同时获得了更高的精度

脱离现实场景谈准确率的语音识别技术统统都是耍流氓

12月12日，阿里云智能语音技术总监鄢志杰在开发者社区中透露，团队在语音识别声学模型研究上再获重大进展。通过改进的LC-BLSTM模型，使其规模庞大的线上语音识别服务的解码速度提升了3倍，并同时获得了更高的精度。

LC-BLSTM算法是深度学习中的一种，一般的深度学习算法只能看到上下文的一点点,BLSTM理论上可以看到无穷远的上下文，所以可以更好的理解人类的语言。

但传统的BLSTM在语音识别任务上，会带来很大的解码延迟，只能用于离线语音识别，无法用于在线实时解码。而阿里云此前上线的LC-BLSTM则很好的解决了延迟问题，也是该算法在工业界的全球首次落地。

阿里云又是如何将解码速度再次提升3倍的?鄢志杰并未透露更多细节。

对于行业内的识别率之争，鄢志杰泼了一盆冷水：夸张的准确率只可能在非常受限的场景下获得。如果在一个热烈讨论的会议室，掏出手机做会议记录，别说97%，断断续续勉强看懂就不错了。

“在众多真正有意义的场景下，语音识别的准确率远没有新闻标题上宣传的那么高，脱离现实场景去谈准确率统统都是耍流氓。”鄢志杰说，我认为语音行业的“圈内人”应该更严肃的去思考，我们在学术研究上到底在哪些方面取得了实质性的进展，在工业应用上到底在哪些方面实实在在的帮助到大众。

上个月，搜狗、百度、科大讯飞分别召开发布会，公布了自己在语音识别技术方面的成绩，三家都对外界称，自己的语音识别系统“准确率达到97%”。

鄢志杰在阿里云研究领域主要包括语音识别、语音合成、说话人识别验证、OCR/ 手写识别、机器学习算法等。长期担任语音领域顶级学术会议及期刊的专家评审，并拥有多项美国及PCT专利，目前是 IEEE senior member。

注：本文由 阿里云 投稿数据猿发布。

欢迎更多大数据企业、爱好者投稿数据猿，来稿请直接投递至：tougao@datayuan.cn

来源：数据猿

收藏分享

声明：数据猿尊重媒体行业规范，相关内容都会注明来源与作者；转载我们原创内容时，也请务必注明“来源：数据猿”与作者名称，否则将会受到数据猿追责。

刷新相关文章

: 旅游交通大数据——大众旅游时代的“富矿”

: #榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...

: 张涵诚：大数据招商平台可推动地方供给侧改革

我要评论

专家推荐more >

: 涂子沛

: 桂洪冠

: 马亮

: 白冬立

: 傅志华

: 张涵诚

: 韩涵

: 车品觉

: 陈明

: 赵乾坤

: 刘德彬

: 董飞

人物专访more >

当数据被纳入“生产要素”，我们离

当数据被纳入“生产要素”，我们离

活动推荐more >

不容错过的资讯

大数据学堂more >

【每周一本书】《数据即未来——

【每周一本书】《数据即未来——

大数据企业推荐more >

: 九次方丨贡献中国数据智慧

: 星图数据丨Data turn biz

: 晶赞科技丨数据推动产业智能化

: TalkingData丨移动·数据·价

: 百分点丨大数据践行者

热门职位more >

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

[2016/08-10]

大数据活动公告

More>

大家都在搜

大数据案例创业大数据北京大数据阿里巴巴云计算营销数据分析互联网融资大数据应用物联网互联网+ 大数据美国大数据春节百度数据挖掘融资租赁开封人工智能金融大数据24小时数据猿大数据24小时医疗农业大数据大数据24小时电商小米

返回顶部