您当前的位置 :浙江在线 > 时政新闻 > 时政 正文

能唠嗑又会自己开的车正在来的路上!网友:变形金刚也快来了

字体:
— 2023—
04/25
14:11:47
2023-04-25 14:11:47 来源: 潮新闻 记者 金春华

  能唠嗑又会自己开的汽车长啥样?真的能实现吗?

  日前,知名智库工信部赛迪研究院发布了一份研究报告。报告显示,以ChatGPT为代表的生成式AI技术,正在向工业设计、药物研发、材料科学等领域快速扩散。而随着集度、吉利、红旗等汽车企业纷纷宣布支持汽车机器人自然交流,以人工智能为技术驱动的自动驾驶,将成为新能源汽车发展的重要方向。

  报告认为ChatGPT的加入,将给自动驾驶带来三大方面的提升。网友讨论说,不知道是不是会出个变形金刚来。

  正如大家预料,ChatGPT的“第一大招”就是唠嗑——语音交互。这份报告认为,ChatGPT能够给自动驾驶带来语音交互提升,成为提升智能座舱语音交互质量的重要工具。

  确实,现在ChatGPT依托海量参数的预训练大模型产生的那令人惊艳的“对话聊天”,对比市面上现有的机械式的车载智能语音交互模式,实在是一种“降维打击”。其中的关键,就在于ChatGPT强大的理解能力。正如报告所说,由于机器不具备语义理解能力,用户只能通过触摸屏与部分语音相结合的方式,按照指定命令与汽车进行交互,功能的复杂性和关键词的多少成正相关,整个系统机械化运行、功能单一。据相关机构调研,2022年1-8月,语音交互功能在智能座舱的渗透率达到73.3%,但用户对智能语音交互感兴趣程度仅为42.9%。

  但是,ChatGPT能够在沟通中结合用户提出的问题不断做出精准的、连续的回应,一方面通过对模型在车内对话场景的专项定制,可以在车载运行环境中取得优异的识别效果;另一方面模型的学习能力和上下文结合能力,可以让ChatGPT实现连续对话交互。这种语义理解能力应用在车机交互上,最直观的变革就是语音交互更加直接,更符合人类思考的习惯,会更加接近于人与人之间的交流,交互效率直线提升,大幅提升用户体验。

  报告分析“第二大招”其实更为关键,那就是如何破解自动驾驶数据和测试难题。

  我们知道,就像人也得学走路一样,自动驾驶需要通过真实世界的数据来训练、测试和验证模型算法的安全性和准确性。这一过程需要大量数据支持和复杂的驾驶环境,甚至涵盖许多极端环境的“边缘案例”,某种意义上说需要数百年的真实驾驶才能收集构建真正安全的自动驾驶汽车所需的所有数据,并且真实世界的图像数据必须先手动标记,然后才能用于训练AI模型。

  但是,这样的过程所需要的成本是非常之大的,也没有哪家公司承受得了;而且,这更不符合数字时代的研发模式。

  如今,事实已经证明,ChatGPT就具有强大的学习和输出能力,而AIGC(人工智能生产内容)能够灵活运用于写作、绘图、语音、视频等不同维度的创作领域;换言之,就如报告所说:结合自动驾驶模型训练的数据需求,AIGC能够生成任何人类想象到的驾驶场景。而且,相比较而言,合成数据无论从成本还是场景方面都有着无可比拟的优势。因此,第一批出现的合成数据初创公司也主要瞄准了自动驾驶汽车终端市场,帮助自动驾驶企业解决其在自动驾驶系统开发过程中所面临的数据和测试难题。

  在此前的采访中,记者也在百度了解到类似的场景和愿景,比如工程师提到,他们准备用文心一言大模型来识别道路上的物品,到底是石头还是塑料袋,识别路上的各种路标的含义,识别效率可大大提升;比如利用智慧城市的相关成果,结合AIGC,可以更加精细化生成、模拟驾驶场景,而且可以各种重新设置、调整,比如说人流的多少、路况的拥挤程度,乃至路面塌陷、道路封闭等各种极端或突发状况,甚至可以在同时间段设置多种条件的场景来进行训练,让你的车子更智能、反应更敏捷。

  报告中也特别指出,随着AIGC技术持续创新发展,基于AIGC算法模型创建、生成合成数据迎来重大进展,有望解决自动驾驶发展应用过程中的数据限制。一是通过合成数据来改善基准测试数据的质量来实现数据增强和数据模拟,解决数据匮乏、数据质量等问题;二是利用合成数据训练AI模型可以有效避免用户隐私问题;三是合成数据可以自动创建、生成现实世界中难以或者无法采集的数据场景,能有效应对长尾、边缘案例,提高模型算法的准确性、可靠性;四是合成数据技术可以实现更廉价、高效地批量生产自动驾驶模型训练开发所需的海量数据,毕竟人工标注一张图片可能需要6美元,但人工合成的话只需要6美分。

  “第三大招”,报告认为大模型技术路线将启发自动驾驶底层算法跃迁升级,主要有两大启发:

  一是大模型之所以取得成功的非常关键的一点,按照网友说法就是“大力出奇迹”。之前业界大牛们也都说过,大模型训练的模型框架没有改变,但是参数有了十倍百倍的增长,才带来了更好的结果。

  这就是报告中说的,大模型的突现能力,即参数规模超过一个阈值后,模型的“思维链”能力突然就涌现出来,通俗讲就是量变引起质变。ChatGPT的破圈给人工智能业界带来的突破性认知和范式转变是突现能力只存在于大型模型中,而不是小型模型。这对于自动驾驶“跃进式”和“渐进式”两大路线的选择无疑会产生深远影响。

  二是人类反馈的强化学习(RLHF),简单理解就是应用人类处理问题的方式去训练算法。报告说,从2020版本的GPT-3到2022版本的ChatGPT,在控制参数量和训练数据不变的情况下对比监督学习指令微调和RLHF,能够发现在RLHF的参与下,模型的回答更加详实、公正,并且能够拒绝不当和知识范围以外的问题。将这类模式映射到自动驾驶的算法模型中就是应用人类司机正确的驾驶数据来训练算法,驾驶员针对自动驾驶算法的接管视为决策纠正,同时也是正向反馈的强化学习。ChatGPT的成功则证明应用RLHF是可以训练出模型来验证、评价机器模型的输出,使其不断进步,最终达到人类的驾驶水平,在自动驾驶业内毫末通过该方式,在掉头、环岛等公认的困难场景,通过率提升30%以上。

  不久的将来,我们或许真的能吼一嗓子:汽车人,变身!

版权和免责申明

凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。

标签: 汽车;自动驾驶责任编辑: 孙婧宜
国内综合
国际新闻
精品专题
更多资讯