首页 EV新闻

英伟达发布自动驾驶汽车开发开源软件

2025-12-02 16:04 来源: 盖世汽车
核心提示:据悉,Alpamayo-R1属于“视觉-语言-动作”AI模型。

盖世汽车讯 据外媒报道,12月1日,英伟达发布多款开源人工智能(AI)模型,其中包括面向自动驾驶汽车的Alpamayo-R1,以及面向机器人技术与仿真领域的Cosmos工具。英伟达正以一项大胆举措,不断拓展AI研究的边界。

英伟达发布自动驾驶汽车开发开源软件

图片来源:英伟达

Alpamayo-R1软件旨在借助AI领域部分最新的“推理”技术,加速自动驾驶汽车的研发进程。据悉,这款软件属于“视觉-语言-动作”AI模型,也就是说,自动驾驶汽车能够将其传感器组捕捉到的道路路况,转化为自然语言描述。

Alpamayo这一名称源于秘鲁一座攀登难度极大的山峰,该软件的突破性在于,车辆在规划行驶路线时会“自言自语”地进行思考。举个例子,当汽车探测到自行车道时,这款软件会记录下这一路况信息,并说明正在调整行驶路线。

以往的大多数自动驾驶汽车软件,在解释车辆为何选择某一行驶路线时存在局限,这使得工程师难以判断需要改进哪些环节来提升汽车的安全性。

英伟达汽车业务高级营销经理Katie Washabaugh向路透社表示:“推出这款开源软件的核心目的之一,就是让开发者和研究人员能够了解这些模型的运作机制,从而推动整个行业制定出评估其性能的标准方法。”

AR1模型已在GitHub与Hugging Face开放获取,同时英伟达物理AI开放数据集中亦包含其部分训练数据。研究人员还可借助AlpaSim框架对模型性能进行评估。

除AR1外,英伟达的Cosmos平台还提供一套面向物理AI开发的工具集;其中包括为自动驾驶仿真生成激光雷达数据的LidarGen、用于优化神经重建结果的Omniverse NuRec Fixer、用于制定机器人行为规则的Cosmos Policy,以及能在高逼真度仿真环境中训练人形机器人的ProtoMotions3。

目前,全球开发者与研究人员已开始对这些模型展开测试。英伟达生态合作伙伴如Voxel51、1X、Figure AI、Foretellix、Gatik、Oxa、PlusAI和X-Humanoid等,正将Cosmos基础模型应用于自动驾驶及机器人技术项目中。

在数字领域,英伟达正升级其Nemotron工具包。该工具包的亮点包括多说话人自动语音识别模型“MultiTalker Parakeet”,以及可实现实时说话人分离的Sortformer模型。

Nemotron还推出了基于推理技术的AI安全模型,同时提供适用于强化学习和特定领域AI开发的合成数据集。

其他值得关注的更新包括Audio Flamingo 3——这是一款可对语音、音乐及各类声音进行跨模态推理的大型音频语言模型,还有Minitron-SSM——该模型能够在不损失性能的前提下对混合模型进行压缩。

英伟达研究人员还展示了Jet-Nemotron和Nemotron-Flash两款模型,它们均经过优化,可实现高效的语言模型推理并降低延迟。

通过此次发布的一系列成果,英伟达持续将开源AI推向新高度,提供的这些工具为研究人员、开发者以及自主系统创新者均赋予了强大能力。

英伟达凭借其芯片成为AI研发的核心支撑,已然跻身全球市值最高的公司之列。与此同时,该公司还设有规模庞大的软件研究部门,负责发布AI开源代码,以供Palantir Technologies等企业采用。

责任编辑:枯川

返回首页
相关新闻
返回顶部