X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们
欢迎来到科易网(仲恺)技术转移协同创新平台,请 登录 | 注册
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
成果 专家 院校 需求
当前位置: 首页 >  科技成果  > 详细页

[01540866]面向语音语言新一代人工智能关键技术及开放创新平台

交易价格: 面议

所属行业: 人工智能

类型: 非专利

交易方式: 资料待完善

联系人:

所在地:

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述
|
收藏
|

技术详细介绍

人工智能的迅速发展深刻改变人类社会生活、改变世界。语音是人工智能时代最自然便捷的人机沟通方式,语言理解则决定人工智能的高度及在各领域应用的深度和广度。近年来,谷歌、微软、科大讯飞、百度等国内外公司纷纷将语音语言技术攻关和开放平台构建作为关键举措。2017年国务院《新一代人工智能发展规划》明确指出中国语音识别技术世界领先,科技部将智能语音列为首批四个国家新一代人工智能开放创新平台之一,依托科大讯飞承建。语音及语言人工智能技术已成为构建人类命运共同体和推动国家“一带一路”战略的重要支撑,面向语音语言的开放创新平台成为中美人工智能产业及生态竞争的关键制高点。机器的语音和语言智能水平能否超过人类是决定人工智能技术落地和产业发展的关键门槛。针对语音多样性导致机器在真实复杂场景下难以达到媲美人类的听说能力、自然语言的丰富内涵导致机器难以实现对语言的深度理解,以及语音语言服务的实时响应要求导致传统云计算平台难以提供覆盖亿级用户的个性化语音语义服务等难题,该项目历经7年努力,在面向语音语言的四项关键技术上取得突破,首次超过人类水平,并在多行业实现大规模应用,同时构建了业界首个自主进化语音语言开放创新平台,核心创新点如下: 1)提出了时频域全序列卷积神经网络端到端语音识别方法和听感量化编码吸收模型语音合成方法,解决了语音识别和合成针对复杂噪声等真实场景的普适性问题。中文语音识别准确率达到97%并首次超过人类速记员水平,维语藏语语音合成自然度超过4.0分首次达到人类水平。 2)提出面向句子和篇章的统一层次化语义建模方法和面向机器翻译的跨语言语义建模方法,提升机器的语言理解水平,在以SQuAD为代表的机器阅读理解任务达到国际最高水平并超过人类,机器翻译首次达到大学英语六级水平。 3)提出帧级平滑实时语音流计算框架并设计实现了自主进化平台体系,有效支持亿万用户个性化语音语义实时服务,平均语音交互响应时间首次低于200毫秒,自主进化的用户个性化语音识别效果相对提升30%以上。 该项目获授权发明专利81项,主持国家标准2项,相关技术创新在语音识别、语音合成、阅读理解、机器翻译等国际权威竞赛中共获冠军18次,处于国际领先水平。讯飞开放创新平台开发者数已超过70万,过去18个月接入该平台的独立终端数达18亿,日均服务次数达45亿,已形成中国最大的语音语言技术产业生态。首创多款颠覆性人工智能新产品,持续引领全球语音语言应用新趋势,其中讯飞语音输入法月活用户达1.3亿、教育评测产品已服务超过1000万中高考考生;语音安全产品在9.3阅兵、G20、APEC等重大活动安保中发挥重要作用,电信防诈骗系统在安徽省上线仅半年就挽回群众损失5亿元。近3年,项目累计实现销售收入66.21亿元,新增利润9.62亿元,带动“中国声谷”累计实现产值1083.30亿元,新增利润162.50亿元,经济社会效益显著。
人工智能的迅速发展深刻改变人类社会生活、改变世界。语音是人工智能时代最自然便捷的人机沟通方式,语言理解则决定人工智能的高度及在各领域应用的深度和广度。近年来,谷歌、微软、科大讯飞、百度等国内外公司纷纷将语音语言技术攻关和开放平台构建作为关键举措。2017年国务院《新一代人工智能发展规划》明确指出中国语音识别技术世界领先,科技部将智能语音列为首批四个国家新一代人工智能开放创新平台之一,依托科大讯飞承建。语音及语言人工智能技术已成为构建人类命运共同体和推动国家“一带一路”战略的重要支撑,面向语音语言的开放创新平台成为中美人工智能产业及生态竞争的关键制高点。机器的语音和语言智能水平能否超过人类是决定人工智能技术落地和产业发展的关键门槛。针对语音多样性导致机器在真实复杂场景下难以达到媲美人类的听说能力、自然语言的丰富内涵导致机器难以实现对语言的深度理解,以及语音语言服务的实时响应要求导致传统云计算平台难以提供覆盖亿级用户的个性化语音语义服务等难题,该项目历经7年努力,在面向语音语言的四项关键技术上取得突破,首次超过人类水平,并在多行业实现大规模应用,同时构建了业界首个自主进化语音语言开放创新平台,核心创新点如下: 1)提出了时频域全序列卷积神经网络端到端语音识别方法和听感量化编码吸收模型语音合成方法,解决了语音识别和合成针对复杂噪声等真实场景的普适性问题。中文语音识别准确率达到97%并首次超过人类速记员水平,维语藏语语音合成自然度超过4.0分首次达到人类水平。 2)提出面向句子和篇章的统一层次化语义建模方法和面向机器翻译的跨语言语义建模方法,提升机器的语言理解水平,在以SQuAD为代表的机器阅读理解任务达到国际最高水平并超过人类,机器翻译首次达到大学英语六级水平。 3)提出帧级平滑实时语音流计算框架并设计实现了自主进化平台体系,有效支持亿万用户个性化语音语义实时服务,平均语音交互响应时间首次低于200毫秒,自主进化的用户个性化语音识别效果相对提升30%以上。 该项目获授权发明专利81项,主持国家标准2项,相关技术创新在语音识别、语音合成、阅读理解、机器翻译等国际权威竞赛中共获冠军18次,处于国际领先水平。讯飞开放创新平台开发者数已超过70万,过去18个月接入该平台的独立终端数达18亿,日均服务次数达45亿,已形成中国最大的语音语言技术产业生态。首创多款颠覆性人工智能新产品,持续引领全球语音语言应用新趋势,其中讯飞语音输入法月活用户达1.3亿、教育评测产品已服务超过1000万中高考考生;语音安全产品在9.3阅兵、G20、APEC等重大活动安保中发挥重要作用,电信防诈骗系统在安徽省上线仅半年就挽回群众损失5亿元。近3年,项目累计实现销售收入66.21亿元,新增利润9.62亿元,带动“中国声谷”累计实现产值1083.30亿元,新增利润162.50亿元,经济社会效益显著。

推荐服务:

Copyright © 2015 科易网 版权所有 闽ICP备07063032号-5