理想正式启动端到端+VLM的早鸟计划：让自动驾驶成为老司机-壹木网-日常常见问题解答

7月5日消息，理想在今晚的智能驾驶夏季发布会上宣布，正式启动端到端+VLM的早鸟计划。GwR壹木网-日常常见问题解答

据介绍，端到端大的特点就是取掉了NPN，不依赖于先验信息，可以真正实现全国都能开，有导航就能开。GwR壹木网-日常常见问题解答

理想正式启动端到端+VLM的早鸟计划：让自动驾驶成为老司机 GwR壹木网-日常常见问题解答

端到端模型则更进一步，通过传感器将数据输入模型，就能直接输出行驶轨迹。GwR壹木网-日常常见问题解答

通过车内的端到端和大模型部署，可以让自动驾驶快速处理，延迟更低、上限更高，用户所能感受到整套系统的动作、决策更加拟人。GwR壹木网-日常常见问题解答

理想正式启动端到端+VLM的早鸟计划：让自动驾驶成为老司机 GwR壹木网-日常常见问题解答

VLM则是视觉语言模型，整体算法架构是由一个统一的Transformer模型组成，将Prompt（提示词）文本进行Tokenizer（分词器）编码，然后将前视120度和30度相机的图像以及导航地图信息进行视觉信息编码，通过图文对齐模块进行模态对齐，统一交给VLM模型进行自回归推理。GwR壹木网-日常常见问题解答

VLM输出的信息包括对环境的理解、驾驶决策和驾驶轨迹，并传递给系统1控制车辆。GwR壹木网-日常常见问题解答

理想正式启动端到端+VLM的早鸟计划：让自动驾驶成为老司机 GwR壹木网-日常常见问题解答