首页 EV新闻

英伟达发布自动驾驶汽车开发开源软件

2025-12-02 16:04 来源: 盖世汽车

核心提示：据悉，Alpamayo-R1属于“视觉-语言-动作”AI模型。

盖世汽车讯据外媒报道，12月1日，英伟达发布多款开源人工智能（AI）模型，其中包括面向自动驾驶汽车的Alpamayo-R1，以及面向机器人技术与仿真领域的Cosmos工具。英伟达正以一项大胆举措，不断拓展AI研究的边界。

英伟达发布自动驾驶汽车开发开源软件

图片来源：英伟达

Alpamayo-R1软件旨在借助AI领域部分最新的“推理”技术，加速自动驾驶汽车的研发进程。据悉，这款软件属于“视觉-语言-动作”AI模型，也就是说，自动驾驶汽车能够将其传感器组捕捉到的道路路况，转化为自然语言描述。

Alpamayo这一名称源于秘鲁一座攀登难度极大的山峰，该软件的突破性在于，车辆在规划行驶路线时会“自言自语”地进行思考。举个例子，当汽车探测到自行车道时，这款软件会记录下这一路况信息，并说明正在调整行驶路线。

以往的大多数自动驾驶汽车软件，在解释车辆为何选择某一行驶路线时存在局限，这使得工程师难以判断需要改进哪些环节来提升汽车的安全性。

英伟达汽车业务高级营销经理Katie Washabaugh向路透社表示：“推出这款开源软件的核心目的之一，就是让开发者和研究人员能够了解这些模型的运作机制，从而推动整个行业制定出评估其性能的标准方法。”

AR1模型已在GitHub与Hugging Face开放获取，同时英伟达物理AI开放数据集中亦包含其部分训练数据。研究人员还可借助AlpaSim框架对模型性能进行评估。

除AR1外，英伟达的Cosmos平台还提供一套面向物理AI开发的工具集；其中包括为自动驾驶仿真生成激光雷达数据的LidarGen、用于优化神经重建结果的Omniverse NuRec Fixer、用于制定机器人行为规则的Cosmos Policy，以及能在高逼真度仿真环境中训练人形机器人的ProtoMotions3。

目前，全球开发者与研究人员已开始对这些模型展开测试。英伟达生态合作伙伴如Voxel51、1X、Figure AI、Foretellix、Gatik、Oxa、PlusAI和X-Humanoid等，正将Cosmos基础模型应用于自动驾驶及机器人技术项目中。

在数字领域，英伟达正升级其Nemotron工具包。该工具包的亮点包括多说话人自动语音识别模型“MultiTalker Parakeet”，以及可实现实时说话人分离的Sortformer模型。

Nemotron还推出了基于推理技术的AI安全模型，同时提供适用于强化学习和特定领域AI开发的合成数据集。

其他值得关注的更新包括Audio Flamingo 3——这是一款可对语音、音乐及各类声音进行跨模态推理的大型音频语言模型，还有Minitron-SSM——该模型能够在不损失性能的前提下对混合模型进行压缩。

英伟达研究人员还展示了Jet-Nemotron和Nemotron-Flash两款模型，它们均经过优化，可实现高效的语言模型推理并降低延迟。

通过此次发布的一系列成果，英伟达持续将开源AI推向新高度，提供的这些工具为研究人员、开发者以及自主系统创新者均赋予了强大能力。

英伟达凭借其芯片成为AI研发的核心支撑，已然跻身全球市值最高的公司之列。与此同时，该公司还设有规模庞大的软件研究部门，负责发布AI开源代码，以供Palantir Technologies等企业采用。

责任编辑：枯川