来源:睿见Economy
第十五届中国汽车蓝皮书论坛于2023年6月15日-17日在武汉举行。轻舟智航联合创始人、CEO于骞出席并演讲。
(资料图片仅供参考)
在于骞看来,无人驾驶的发展前途是光明的,只不过这个道路很长,行之将至。
“最核心的是要始终围绕用户价值去做。无人驾驶很大程度d上希望能够让我们整个出行和交通更加安全,更加舒适,更加便捷,但这条路会非常长。”他说。
以下为演讲实录:
于骞:无人驾驶是不是忽悠?很大程度上,这段时间大家对整个的无人驾驶都非常悲观,有很多包括像对很多无人驾驶的进展,包括(对)Waymo在内发展都非常地悲观,主持人包括我们中午的讨论,为什么还要敢讲主题叫“将无人驾驶带进现实”。
将无人驾驶带进现实就是轻舟智航奋斗的方向,包括地平线(余)凯哥也跟我说别讲无人驾驶带进现实了,无人驾驶行不行啊?他跟我讲过很多次。我们看无人驾驶带进现实的事儿要干二十年,在二十年里无人驾驶是可以实现的。今天蓝皮书主题是“不负”,我也想表达一下“不负”是不负我们的初心,我们认为这件事儿是能够实现的。
当然在无人驾驶道路上是非常曲折的,有很多不同的路线。其中有一条路线大家都非常清楚,就是Waymo的路线。Waymo从09年开始在X实验室的时间就开始做无人驾驶的项目,即便到今天也没有完全将无人驾驶大范围落地。其实走了一条非常痛苦的一条路,非常难的一条路,当然也取得好的进展。最近大家可以看到它完全无人化的车队已经成规模的运营,这是很挑战的路。
另外一条路是特斯拉,特斯拉走了非常巧妙的路。它以通过智能电动车的方式在不断地推进,可以看到特斯拉走的路非常符合用户价值。
大家可以看到虽然特斯拉现在讲的都是辅助驾驶,讲辅助驾驶讲得比较多,但它自己给自己的最终目标还要实现完全的无人驾驶。可以看到它对它的FSD的命名Full Self-Driving,包括它最终给大家描绘的图景也是无人驾驶的方式。所以我是认为这两条路是都可以通过不同的努力路径来实现最终的无人驾驶。
当然对整个无人驾驶的发展来看,我觉得前途是光明的,只不过这个道路很长,行之将至。在这条道路上我觉得最核心的我们还是要始终围绕用户价值去做这件事儿。我觉得这一点上,不管是每一个我们的供应商来讲还是作为车厂来讲,大家都希望将无人驾驶那一天带到现实中来,因为无人驾驶很大程度上希望能够让我们整个出行和交通更加安全,更加舒适,更加便捷,这都是我们希望无人驾驶能够带来的,但这条路会非常、非常长。
从最早开始做ADAS开始,包括非常早期的ADAS产品也是一步一步这么走过来的。我觉得这条路是个非常现实的路。包括特斯拉也在这条路上一直在一路狂奔,从最早的基础的ADAS功能开始,到往上L2+级的功能,包括现在它做到的高速NOA和城市NOA,最终将无人驾驶带进现实的目标。
最早的从特斯拉的产品的定义名字叫Auto steer,就是基础的L2的功能,包括它的高速NOA到它的FSD进入到城市NOA的阶段,在这条路上来讲最终是有机会走到完全无人驾驶的。
到什么时间我觉得完全无人驾驶才会出现呢?很大程度上应该在城市NOA大范围普及之后,完全的无人驾驶才会出现。比如说现在我们在公开道路上的车,如果现在公开道路上的车有十分之一或者是20%——五分之一的车能够在公开道路上使用城市NOA功能,能够打开的话,我觉得这个离我们最终将无人驾驶的普及就不远了。
为什么这么讲?可以参考像chatGPT的发展,基本上它把地球上有价值的语言文字信号都能够利用起来以后,就可以打开从量变到质变的过程。
当然类比于自动驾驶的行业,当我们在整个地球上所有有价值的街景数据都能为我们所利用的时候,我们(的)模型能力也能把它们用好的情况下,这时候我觉得完全的无人驾驶就会到来。
这里我觉得像高速NOA和城市NOA这样的阶段是必不可少的,一定会度过的,为什么?就是你怎么去验证完全的无人驾驶能够到来?它一定是通过大量的统计数据。比如说我的机器驾驶安全程度比人安全十倍,这个时间点是不是就可以真正的完全去实现了?但这个一定要通过更加广泛的验证才能得到。也有其他的观点提到可能不需要十倍,也就五倍搞定了,也许那两倍靠保险或者其他的方式也能够搞定,但是肯定它需要通过大范围的验证来实现完全的商业上可行。所以我觉得现在我们所处的这条道路是可以走向完全的无人驾驶,只不过这个道路会比较长。
我们提过在通向无人驾驶道路来讲有一个非常重要的节点就是城市NOA,它是辅助驾驶的天花板,也是无人驾驶的入门槛。为什么这么讲?这里需要大量数据的积累。
从自动驾驶的分水岭来讲,早期的ADAS方案是没有办法进化到完全的自动驾驶。因为这里它都是一手交钱一手交货的这种交付,没有办法去触及到数据。大家知道自动驾驶三个主要要素:算法、算力和数据,这个数据是非常关键的,需要不断OTA升级,有数据的触及才可以最终地实现。
所以在城市NOA,我们认为这里需要大量数据的积累,才能最终将完全的无人驾驶带到我们的现实中来。当然(要)做到很好的城市NOA体验,现在其实挑战很大。我们现在看到城市NOA产品价值还没有完全体现。大部分我们看到(的)还是做的非常基础的功能,包括我也非常赞同高速NOA还没有做好,很多地方的用户体验并不好,更别提城市NOA了。很多城市的NOA的体验还是属于战战兢兢的状态。当然我也看到一些产品的体验在逐渐地变好,尤其像泊车的场景,有一些泊车的场景已经能做到非常好的体验了。所以这就是用户价值的体现。
我听到有一些泊车的测试工程师跟我反馈说,测试完泊车的体验以后,自己的泊车能力都下降了,发现自己都不想泊了,因为泊得确实很好。我觉得在高速NOA到城市NOA过程中一定会有这样的过程,使得大家真正地愿意为智能驾驶这个体验来买单,我觉得这个才是我们最终将城市NOA带到现实,将无人驾驶带到现实的必经之路,这是围绕着用户价值去打造。
在准备材料之前,我们同事问我到底要不要讲技术内容?我说我一定要讲技术内容,因为自动驾驶大量的背后需要技术的创新,我们不想跟行业讲我们不仅仅是拿了哪些认证,更希望在技术创新上给大家多分享我们现在到底怎样才能真正的把这些非常有挑战的任务完成好,在现在这个阶段。当然我尽量会把技术背后的用户价值和客户价值讲清楚。
大家看到最近的chatGPT的发展有两方面的层次:一方面很重要的是多模态、多任务的学习,这个在我们自动驾驶是非常、非常关键的一步。为什么?因为车载的算力是非常有限的,如果我们把这么复杂的自动驾驶功能,这些感知的能力切分成很多、很多非常小的模块的话,我们是没有办法在这么有限的资源下实现这样的能力。所以我们轻舟智航刚出来的时候,因为我们人很少无法把团队切分成很多小模块进行开发,所以我们很早就采用这种大的模型方法,去采用BEV,去实现非常复杂的感知能力。
我们可以做到在一个车载模型上跑数十个不同的任务来实现效率的提升,当然也非常感谢地平线对我们的支持。我们很早在地平线的征程5芯片上实现了BEV包括时序的EV模型的部署,达到了量产的状态。
可以讲,大家经常讲的融合是前融合用的比较多,我们是行业比较早的把前、中、后融合,包括时序融合用在车规级量产芯片的公司。
这里我们还有非常灵活的框架,可以同时支持不同传感器的信息,包括在底层的,包括像视觉传感器,像毫米波包括激光雷达,这样我们可以更加方便地适配不同的车型的传感器要求,使得我们在不同的车型配置上能够采用同样的模型来实现这样的能力。
这是完全视觉感知能力,包括在城市道路,过高架、城区包括拥挤路段、快速路段还有隧道。这里是多任务,我们只列了一部分,包括像一般障碍物和语义的信息。
我们在越来越复杂的感知能力上体现确实需要多种传感器的融合,同时需要多任务的网络来进行这样的任务。
另外关于大家提到的行泊一体,我这里举的例子并不是我们完全要做泊车的任务。为什么很多泊车体验之前做得不好?一方面是算力有限,另外是资源没有把算力资源充分利用起来,大部分采用的是拼接或者分时方案把行泊做在一起。我认为真正的行泊体验一定是在用户侧体验一致,不需要手动切换,能够实现真正的完整体验。这里我们把整个泊车感知的能力通过我们BEV网络重新体现了出来,包括在泊车的传感器,我们也可以更多地把它在行车过程中利用起来,实现真正的行泊一体的完整方案。
包括我们在用我们的鱼眼摄像头在行车上的体验,可以看到在左图中。包括我们在泊车上利用一些BEV,包像括占据网格实现的功能,可以把传统的技术点在一些更加强的算力、更加好的方法的计算框架下来实现的能力,所以我们认为新的用户体验上一定要有新的方法才能真正达到更好的用户体验。
刚才也提到无图,在城市NOA里面我认为无图或者轻地图的方式是非常必要的。在高速的地图上来讲,这个还是比较容易实现的,通过我们的采图包括一定程度的更新,但是一旦进入到城市的范围内,这个地图的普及扩大会非常、非常有挑战。
这里给大家介绍我们的感知能力,在这种只基于SD Map的情况下,我们基于Curb来实现道路几何的感知和SD Map融合,来具备通过复杂路口以及精确的拓扑的建图能力,从而实时地把我们的感知能力和标精地图匹配起来,来达到在城市内部实现比较复杂的驾驶能力。
除了感知和地图能力以外,规控也是在城市导航里面非常具有挑战的一部分。尤其在中国道路情况下,有各种各样的像匝道包括像无保护的左转以及窄路的通行都是非常挑战的,在城市环境下是必不可少的。
对于轻舟智航来讲,我们很早在对驾驶行为方面做了大量的工作,使得我们能够比较好地应对城市内部的驾驶体验。在高速上也是很需要的,尤其像智慧躲闪的情况,对动态障碍物更好地博弈的策略。
大家普遍都是认可像“时空联合规划”的方法,这是我们在行业中最早推出来并把它在实车在车规量产芯片上把它完全实现跑起来的方法。传统的方法大部分通过时空解耦的方法,首先在空间中选择一条轨迹再去优化速度。这样的方法对于城市内部的道路是基本上不可能的,会造成很多手写规则逻辑的问题。所以我们通过一个更好的时空联合规划的优化器,把这件事儿大量减少人工参与来实现。
当然良好的感知、规控的能力都离不开我们在数据方面的积累和数据方面的使用能力。我们在行业里也是很早把这种基于纯视觉的NeRF的建图方式和我们的三维重建的真值标注的系统结合在一起,实现大规模地非监督形式的标注,使得我们整体的标注效率非常之高。
这也可以看到,我们基本上可以实现绝大部分的任务都是靠非监督学习来实现的。这里我也是看到像在所谓大模型里另外一个非常重要的基石就是能够很好地使用非监督学习,这个也是非常需要的。
我们成立四年的时间,我们也得到了很多认可包括一些论文的认可。今天我们有三篇论文入选CVPR,还有之前我们也有2021年有CVPR的论文包括期刊的论文也有些软著和我们专利的申请。
包括在一些行业的大会里,我们也有像(在)世界人工智能大会我们是在多任务网络学习里获得第一名,在深度估计KITTI也是排名第一,在Argroverse(国际预测挑战赛)从2021年到2022两次我们都是前三名,在2021年我们还拿到了Argroverse的冠军,都是重量级的国际比赛。
在这里我有一个倡导,在城市范围大规模的导航能力出现的时候,我们特别需要数据方面的积累。尤其在数据使用和共享上还有欠缺很多机制以及规范的标准,需要全行业的联动和推动,让我们把数据的能力能够充分建立起来,需要航绘企业还有上下游的合作伙伴群策群力,我觉得地平线包括和贾可老师推出的公约数(平台)方式非常好,能够让我们把很多重复的工作在公约数的倡导下建立起来。
我们在量产交付中还遇到了很多挑战和困难,比如提到的极致体验和成本怎么去区分。大部分来讲,我们现在智驾的体验还达不到消费者愿意为它买单(的程度),所以只停留在3%-5%的成本,我也非常赞同现在的整个智驾在消费者面前还不是非常必要的选项。只有我们把体验做到非常极致了,让消费者愿意为这件事情买单,这件事情才能形成正向循环,否则大家只能是比成本来杀价格。我觉得正向循环一定要让体验达到一定效果才可以实现,另外在成本方面,我们一定要避免堆料来实现更好的客户价值。
这里还涉及到一次性交付和持续OTA的挑战,因为智驾的方案不是简单的一手交钱一手交货的问题了,更多需要不断OTA升级,使得它越用越好,常用常新,这里愿意为主机厂客户提供一整套工具链产品,让他们大幅度降低开发的成本。
最后关于全栈自研和自主可控的讨论,这里行业比较多了,我不多讲了。
整体从现在的行业发展来讲,(自动驾驶)是属于行业非常早期,但是在今年车展会看到基本上在有L2及以上的车款已经超过77%,所以在行业非常快的爆发期。包括高速NOA渗透率从个位数预计到2025年也会进入到25%,从行业的估计来讲,所以这是行业发展非常快速的时期。
当然我们希望在2030年可以看到更多的具备非常高级的辅助驾驶功能包括L3甚至L4的功能能够出现在我们的车上。我觉得从整个人工智能发展过程中,通用人工智能可能离我们不会太远。从我们未来往现在看的话,很有可能自动驾驶只是很简单的问题,很多其他问题还要比这个更加复杂,等我们真正走到那一步往回看的时候可以有很多不一样的感受。
就像今天吴声老师讲到的,伟大很多情况下没办法设计出来的,保不齐某天某家公司提出非常好的方法或者很好的技术能够使得将我们整个技术大范围提升,就像OpenAI在自然语言理解里面来实现的东西一样。道阻且长,不负韶华,我们希望将无人驾驶带进现实。