܄

阿里达摩院公布语音AI与AI EARTH两项新进展:能逼近真人语音交互,也能看懂地球每一寸土地变化

【数据猿导读】 语音AI的核心是让机器听懂人话,并能开口说话,语音合成和语音识别技术是实现这些目标的基础。但由于过去几年业界在语音模型上未能有突破性创新,高精度的语音交互任务长期依赖云端算力,造成了语音指令处理不可避免的延时等问题。

阿里达摩院公布语音AI与AI EARTH两项新进展:能逼近真人语音交互,也能看懂地球每一寸土地变化

数据猿作为“2020云栖大会”官方受邀媒体,为大家带来了此次盛会中最精彩的报道内容。

提示:可关注数据猿最新推出的【产业图谱+企业盘点】策划活动:《中国数据智能产业最具商业合作价值企业》推荐进行中。

9月18日,在2020云栖大会上,达摩院公布了语音AI技术的最新突破:端上语音识别和语音合成能力首次达到媲美云端的水平,这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。据介绍,达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景大规模应用,正全面对外开放。

语音AI的核心是让机器听懂人话,并能开口说话,语音合成和语音识别技术是实现这些目标的基础。但由于过去几年业界在语音模型上未能有突破性创新,高精度的语音交互任务长期依赖云端算力,造成了语音指令处理不可避免的延时等问题。

此次达摩院率先在算法模型上实现创新,推出E2E-ASR端到端语音识别技术及全新的端上KAN-TTS语音合成技术,首次在移动终端上实现接近云端的语音识别与合成效果。

阿里_达摩院_语音AI_AI_EARTH_地球-1

据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。达摩院研发的语音识别系统,可纯离线、低成本部署在手机端,原型系统不到40MB,识别效果媲美超过100GB的达摩院上一代DFSMN-CTC云端系统。

继去年发布仿真率可达97%的自研KAN-TTS语音合成模型后,达摩院此次在移动端实现了对语音模型的“大瘦身”,相比云端,端上模型大小压缩了101倍,计算量压缩35倍,通过终端算力即可快速复现逼近真人的语音。例如,高德地图近期发布了利用达摩院全新语音技术合成的李佳琦、林志玲、小团团等明星导航语音包,语音效果较之前更自然,断网状态下语音导航也不会中断。
 
达摩院语音实验室负责人鄢志杰表示,“在终端处理语音任务一直是学术界和工业界的难题,达摩院最新的语音技术有效释放了终端设备的能力,让终端也能轻松处理语音任务,我们相信,在终端算力和云端算力的协同支撑下,未来语音交互将无处不在。”

阿里_达摩院_语音AI_AI_EARTH_地球-2

过去几年,阿里语音AI取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。

此外,阿里达摩院此次还发布了AI EARTH,全球首次实现多源对地观测数据分析,可看懂地球每一寸土地变化,可精准分析遥感卫星、无人机等影像信息。

从太空看地球,达摩院找到了新方法!
AI EARTH为达摩院发布的首个泛自然资源行业AI引擎,首次实现对天、空、地多源数据精准分析的能力,可清晰记录分析地球每一寸土地变化,大到山川植被湖泊面积变化、小到农作物生长情况,都能快速、精准分析。
 
卫星遥感影像是人类观测地球的主要途径,但随着无人机影像、实时视频流、气象信息、IoT数据等全新数据源的涌现,数据规模呈几何级增长,人工观测和经验分析的方式已无法满足海量观测数据的需求。

阿里_达摩院_语音AI_AI_EARTH_地球-3

AI EARTH可分析无人机影像、实时视频流、气象信息、IoT数据等数据源
 
AI EARTH采用达摩院视觉AI技术,是业界首个实现多源对地观测数据的智能分析的解决方案,支持RGB影像、多光谱影像、高光谱影像及普通视频影像,可快速提取地表覆盖现状信息和时空动态变化信息,并且拥有比传统遥感方案更高的精度。
 
据介绍,AI EARTH利用主动学习和半监督学习等技术,自研了多个创新算法。该引擎集成了达摩院自研遥感目标检测及分割框架,引入多尺度环境语义信息,实现遥感图像目标检测准确率的突破。以大棚监测为例,北京市规划和自然资源委员会使用阿里遥感技术,违章大棚房监测准确率达到90%。此外,遥感应用场景极为丰富和多样,同一解译对象在不同空间、时间维度下差异巨大,AI EARTH通过域自适应等迁移学习技术,大幅提升了AI算法在不同场景下的精度及泛化能力。
 
达摩院资深算法专家李昊表示,“未来AI对多源数据的融合分析是人类对地观测的趋势,我们希望AI EARTH能在空天信息领域发挥更大的价值,让AI看懂地球。”
 
阿里巴巴是国内最早将AI技术应用于卫星遥感影像领域的公司之一,相关研究成果已广泛应用于各行各业。今年汛情期间,达摩院团队一周内就开发训练出应用于防汛关键期的水体识别算法,影像分析速度提升百倍,大大提升防汛工作智能化水平。


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

数据猿创始人兼CEO牟蕾:数据积累、成本可控、应用场景落地是AI规模化三要素
数据猿创始人兼CEO牟蕾:数据积累、成本可控、应用场景落地是A...
阿里巴巴成立云原生技术委员会 云原生升级为阿里技术新战略
阿里巴巴成立云原生技术委员会 云原生升级为阿里技术新战略
阿里云发布金融智能决策引擎 将网贷审批耗时缩短近70%
阿里云发布金融智能决策引擎 将网贷审批耗时缩短近70%

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部