首页 > 汽车性能 > 汽车性能 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

汽车性能更多>>

官方确认乐道L60成为滴滴专车:对标比亚迪汉 一季度财报公布,李斌再谈对蔚来四季度盈利有信心 长城汽车携手清华美院,畅聊魏牌全新高山背后的东方美学故事 一汽红旗5月销量达到34130辆 同比增长10.8% 西安欧亚学院「春山里」入住倒计时!快来Pick你的理想住宿生活! vivo X200 Pro 5G手机优惠,原价4899到手4057 vivo X Fold5大折叠新机重量或低于219克 荣耀和它的新CEO:走出原生家庭 归来仍是王者 索尼中标达州融媒新大楼建设项目,首批设备交付赋能融媒生态战略升级! 小米多款新品认证曝光:平板、时尚影像套装、手表,都来了! 小米汽车回应UWB智能钥匙优势 华为全栈赋能 猛士M817粤港澳车展内饰首秀 江铃汽车(000550):持续发力海外开拓市场空间 深入推进新能源与智能化转型 MONA 03卖这么便宜,何小鹏能赚到钱吗? 历史镜鉴:标致605在E级轿车市场的得与失 三十而立:青花汾酒品质生活大赏,以AI与潮流文化对话年轻世代 限时7.99万起售:东风纳米06上市,10万元内露营“好搭子” 30万级SUV对决!汉兰达VS冠道,家用怎么选? 试驾红旗H5 PHEV:豪华实力兼具性能与经济性 长安汽车张德勇:深蓝汽车有望今年达到盈亏平衡 试驾|燃油车的魅力依旧-福特蒙迪欧VS大众帕萨特 李书福:国内几乎所有的造车新势力都是到吉利挖人的 理想L9智能焕新版与2025款问界M9,谁才是50万级最佳之选? 新款长安逸动轿车申报,提供1.5T燃油 /1.5升插混版 闭眼买,5月第三周MPV销量榜别克GL8第4名、菱智第18名 15万左右拥有一台合资的轿跑SUV深度试驾一汽丰田bZ5 亚洲龙双擎VS汉DM-i:25万级混动轿车对决,看完再决定 精打细算买 MPV!30-40 万价位车型深度解析​ 新一代丰田RAV4发布 全系混动,外观硬派 吉利银河M9全球首发!定位大六座旗舰SUV