在2024中国汽车重庆论坛上,理想汽车董事长李想发表了演讲。
李想表示:我今天分享我们在过去半年多的时间做的一个重要技术的突破,是关于自动驾驶的技术的突破。
自己研发自动驾驶时,还有一个灵感来自妻子,曾经妻子开车总是在剐蹭,无论比较大的宝马X6还是比较灵活的高尔夫GTI。
于是他给妻子报名了宝马驾驶学院的初级班,经过一天的训练就不再剐蹭了。
宝马培训班教了两个事情:一是教你看路的能力,二是教你刹车的能力,只经过这么一天的训练,我爱人就彻底和刮蹭告别了。
在接下来的十几年里,没有出现过任何的刮蹭,所以这是人类学习的一个方式。
他们在考虑如何把这样能力给到车上时,就看到了一个很重要的技术——VLM的视觉语言模型。
但是大模型因为体积太大,且有云端响应时间较长的风险,如何把一个视觉大语言模型进行足够压缩,最后放到车上去,是他们团队的重点任务。
视觉语言模型能够在面对一个没有红绿灯的左转路口提前作出预判,来知道我这个路口如何进行特殊的处理、进行复杂的处理,它还有另外一个重要的功能,就是告别高清地图。
因为视觉语言模型能够像人类一样去读懂导航地图,导航地图的横向、纵向、速度、时间,包含红绿灯,哪怕有车辆遮挡红绿灯,也不会再成为问题。
巧合的是,理想的AD Max车型有两颗Orin-X芯片,其中一颗芯片可以运行一个压缩到20亿规模的VLM模型。
经过验证,实际效果非常令人兴奋,理想认为,最早在今年年底、最晚在明年上半年,理想汽车有监督的L3级自动驾驶,就能批量向用户交付。