新闻中心

科大讯飞高级副总裁杜兰:如何跨越AI技术研发到产业落地鸿沟

Writer: admin Time:2024-03-31 Browse:52

  ·根据Gartner技术成熟度曲线,任何一项技术由研发到产业化应用落地通常要5-10年。这期间要穿越期望膨胀期、泡沫破裂低谷期、和生产成熟期,才会迎来真正的产业春天。

  ·从核心源头技术,到解决消费、医疗等各行各业实际问题的技术,经过了两级放大,一级是从基础算法开始,再形成像语音识别、语音合成、自然语言理解、机器翻译等常用技术;二级是在具体使用场景下,结合专家的定标和数据的优化,才能够成为一个解决实际问题的技术。

  从技术的研发,到将技术产业化落地去真正解决人们生产生活的实际需求,这中间需要跨越怎样的鸿沟?

  9月2日,在2022WAIC人工智能与产业融合论坛的主题演讲上,科大讯⻜高级副总裁杜兰分享了科大讯⻜创业23年来,探索人工智能和产业融合的四大路径:用热爱和坚守掌握核心源头技术、用源头技术创新带动全局规划、用系统性创新解决社会重大刚需命题,以及用产业生态搭建让创新生生不息。

  对于人工智能和产业融合的难度,以现在看起来“稀松平常”的语音识别技术可以直观理解。“从刚开始识别10个英文数字、到连续识别一句话、到实验室场景识别准确率 超过95%但现实环境却只能下降到70%、再到经过系统性创新算法优化和大数据⻓期 积累后准确率达到95%,现在讯⻜输入法的准确率已经达到98%,整个‘技术进化’过程足足耗费全球专家70多年时间。”杜兰说道。

  根据Gartner技术成熟度曲线,任何一项技术由研发到产业化应用落地通常要5-10年,杜兰说,这期间要穿越期望膨胀期、泡沫破裂低谷期和生产成熟期,才会迎来真正的产业春天。“我希望大家对核心源头技术创新要有耐心,更要有⻓期坚守的心态”。

  杜兰认为,从技术研发,迈向规模化应用落地,需要经历“两级放大器”效应。在这个过程中,关键是要结合技术的特点和各个应用方向,提前做好前后端贯穿的机制设计,规划好技术路线,从而让核心源头技术创新更快更好地带动全局规划。

  什么是技术的“两级放大器”效应?从核心源头技术,到解决消费、医疗等各行各业实际问题的技术,经过了两级放大,一级是从基础算法开始,再形成像语音识别、语音合成、自然语言理解、机器翻译等常用技术;二级是在具体使用场景下,结合专家的定标和数据的优化,才能够成为一个解决实际问题的技术。经过‘两级放大器’效应后,才能够带动整个产业的落地和发展。

  “和移动互联网带来的好玩新奇酷炫应用不同,人工智能要解决的是人类生产生活的刚需命题,这必须靠系统性创新。”杜兰认为,系统性创新分为三个阶段:从单点的技术突破开始,到解决单个场景的应用问题,再到形成行业级的解决方案。

  杜兰以消费者领域的C端产品讯⻜翻译机为例,首先,科大讯⻜机器翻译系统参加 CATTI全国翻译专业资格(水平)科研测试,达到专业译员水平,就是突破了单点技 术。然后,以机器翻译技术作为核心,同时还要融合语音识别、语音合成、⻨克⻛阵 列等技术,形成了讯⻜翻译机的核心功能,在真实场景中去解决跨语言沟通问题。最后,要贯通多个关联的场景应用,形成行业级的解决方案。

  对于生态的建设,杜兰介绍,2010年以来,讯⻜开放平台就开始把核心技术能力开放给各行各业的开发者,目前已经将498项人工智能能力开放给352.7万开发者团队,开发出154万个应用,链接了超过500万生态伙伴。“希望全社会共同关注新技术的 发展和落地,打造一个鼓励创新、宽容失败和拒绝平庸的产业生态环境。”杜兰在演讲结尾时说。

新闻中心

CONTACT US

电话:400-123-4567

Email: admin@baidu.com

传真:+86-123-4567

手机:13888888888