首页 > 资讯 > 城市

城市NOA正在重塑智能驾驶竞争

2024/03/14 16:48      智车科技   


  本文来源:智车科技

  01

  引言

  目前城市NOA成为自动驾驶行业的必争之地,一片热火朝天,争先恐后的场面,好不热闹。城市NOA作为目前最受欢迎的自动驾驶产品,也作为最多、最有用的自动驾驶落地场景无疑将成为2024年,乃至今后几年间自动驾驶的必争之地。

  作为8年的自动驾驶从业者,曾参与落地和量产HWP和HWA项目,如今这两个词渐渐从自动驾驶圈淡出,转而映入人们眼帘的是NOA、NGP、NOH……,但不论是HWA还是NOA归根结底其背后的功能、技术都是一致的,今天我们一起聊聊城市NOA的现状。

  城市NOA的市场现状

  首先看看”队形“:

  第一梯队代表:特斯拉、小鹏、理想、蔚来、极狐、阿维塔、问界等,已在基本在去年(2023年)实现城市NOA落地。

  第二梯队代表:智己、比亚迪、极越、魏牌、零跑、极氪等,计划2024年内落地城市NOA。

  再看一看头部玩家对外公布的NOA“开城”计划:

  看了上表,四个字形容:争先恐后。

  关于”NOA”这个名字,其实不同的企业为了在公关上体现差异化,都先从名字下手:比如华为称之为NCA,毫末智行称之为NOH、小鹏叫NGP、蔚来称之为NOP、理想和特斯拉则都是命名为NOA,但究其功能和应用场景都大差不差。这一功能的首发是特斯拉,后来者竞相对标、学习,但是都属于“一直在模仿,基本未超越”的状态。

  城市NOA的功能场景

  一次体验城市NOA大约是去年的7、8份,当时体验的车型是阿维塔11,这款车的智驾系统由华为全栈研发。试乘完给我的体验是:现在量产状态的自动驾驶功能竟如此强大!当时我们试驾的路线包括高架、桥下路线,基本是从出了4S店就激活了NOA,在一个十字路口,直接很轻松就完成了右转操作。由于十字路口本身路况复杂,电动车、行人就比较多,再加上这个场景下基本都没有车道线,所以还是比较难的场景,它竟没有出现卡顿。其他场景给我的感觉是“稳”,心里有底。

  简单分享了我的第一次试乘体验,那么下面一起来看看当前城市NOA究竟有哪些功能、能应对哪些场景,又能能给用户带来哪些体验呢?

  看一下功能列表

  ·智能绕障:智能识别异型车辆、施工路障、锥形桶等障碍物,实现安全避让

  ·切入避让:智能识别加塞车辆,实现车辆安全避让

  ·交通灯识别与控车:红灯刹停、黄灯减速、绿灯行驶

  ·智能导航跟随:跟随导航路线,智能变道

  ·城市路口通行:系统智能识别分岔路口、可实现路口智能转弯、路口博弈等多种分岔路口通行场景

  ·待转区通行:系统识别待转区虚线,自动通行

  ·礼让行人:智能识别行人、非机动车,实现安全避让

  ·隧道通行:稳定识别光线变化,缓行车辆、减速避让

  ·智能引领上下匝道

  ·环岛通行

  ·拥堵变道

  其实看看这些功能,再看自动化能力,基本是已经达到了L3的水平了。但是为何大家都只说L2+、L2.5、L2.9……难道是太谦虚了?当然不是啦,都恨不得说它是L5呢。说出这句话的时候,就等于说:“自动驾驶出了事故,我负责”!这话现在没人敢说!

  确实是,以现在的技术水平,还真没人敢说。奔驰好像说了,但是我没看到几辆车在路上跑,可能是大家不相信,也可能是它自己也不相信。

  但是,我相信,那一天它会来,且不会太远了。

  02

  城市NOA的技术路线

  最近这几年,“重感知、轻地图”、“BEV+thansformer”,已被说烂了。

  从目前的落地方案看,主要有两类:

  一是“重感知”方案。通常,城市NOA多采用激光雷达,但2023年下半年“纯视觉”城市NOA方案呼之欲出,如百度Apollo City Driving Max、大疆车载成行平台-9V等。

  二是“轻地图”方案。2023年市场呼声从”重高精地图“逐渐转向“去/轻高精地图” 。因此,不依赖高精地图的城市NOA方案强势登场,如华为的ADS2.0,小鹏的XNGP等。

  这里先说说“轻地图”。

  早在19年,部门负责人就说了一句:不能要地图,我们现在太依赖地图了,要把地图去了。现在看来,领导有远见。

  那时的方案真的是太依赖地图了:没了地图,摄像头的车道线靠不住、没了地图匝道上不去、没地图匝道也下不来,没了地图我就不知道路在哪?相当于,没有地图就是瞎子。激光雷达、摄像头、毫米波雷达没有地图的加持几乎不敢“苟活”。

  为什么会这样呢,因为高精地图确实好:

  1)能告知系统更远处的信息、先验的信息;你想所有地图数据都在已经在我“脑子”里了,我到一个位置我提前已提取,换句话说:闭着眼就都能找到道路。

  2)能告知系统看不清的信息,例如车道线,尤其是下匝道、十字路口这些位置的车道线;还有一些道路标识、坡度信息、特殊路段等等。

  但是现在为什么又要走“轻地图”路线,说白了就是不想太依赖地图。因为地图有几个致命的缺点:

  1)成本高,采集全国的高速、城市道路的高精地图、还要保持地图数据的新鲜度,是巨大的时间和资金投入要知道汽车这个产品对零部件的成本可是很敏感的。所以这一点是万万不能接受的。

  2)适应性差,试想一下:一个用户买了一台有自动驾驶功能的车,一次他心血来潮想给朋友炫耀一下时,系统提示不在ODD(操作运行域,简言之就是激活条件)内,仔细一看是因为这个位置没有高精地图覆盖,所以开不了自动驾驶。这就尴尬了。

  所以,必须“轻地图”,甚至“去地图”!

  既然决定要轻地图,那就必须克服其不足,发扬其优点,所以业内提出了“重感知”。

  这里,个人觉得“重感知”说法不够准确,难道用地图就不重感知吗?只能说用地图,不是实时的感知信息,说到底高精地图和那些传感器的信息不都是感知信息吗?只不过,以前是偏向依赖先验感知信息,现在是偏向依赖实时感知信息罢了。

  原先有地图的时候,车道拓扑根据定位车道和地图的拓扑规则,直接提取出来当前路段的信息。想提多长,提多长,一般是前200米,后50米。这多好,不费吹灰之力,250米的道路信息:车道线、分叉、合并、限速等等一系列信息就有了。紧接着后面的障碍物按照道路坐标系(frenet坐标系)往上“一铺”,哪个障碍物在哪个车道,一目了然。然后根据这些信息去做决策,规划就可以了。

  现在要用"BEV"来解决,传感器真实视角感知到的信息需要转化成鸟瞰模式,这样输出给决策系统,这样方便进行路径规划。同时要加强和提高摄像头对道路信息的感知能力,原来由地图提供的信息,现在需要摄像头来做。

  我们一起来看看目前感知的几个技术路线:前融合、中融合、后融合

  后融合:这种情况下一般主机厂会用所谓的smart sensor来搞,就是每种传感器都有自己算法,各自处理生成目标数据,当所有的传感器生成目标数据,并且时间同步后,就可进行数据融合。

  (后融合算法典型结构)

  后融合的优点是解耦性好,且各传感器可以互为冗余备份。但缺点也很明显,由于后融合是基于规则处理的,会受到先验思路(从结果推向过程)限制,并且传感器各自对目标识别后再融合,中间也损失了很多有效信息,对感知精度也会造成影响。

  (前融合算法典型结构)

  前融合,是指把各传感器的数据采集后,经过数据同步,对这些原始数据进行融合。

  更早进行数据融合,降低了数据损失的可能。但由于视觉数据和激光雷达点云数据所处坐标维度不同,所以融合起来难度很大,需要建立精准的雷达坐标系、三维世界坐标系、摄像头坐标系等等,同时对平台算力提出了很高要求(动辄几百TOPS甚至上千TOPS的算力就是这么来的)。

  (中融合算法典型结构)

  再聊一下中融合。

  中融合,也称为特征级融合:先分别从传感器的原始数据中获取有效的特征数据,再将有效特征融合,特征信息包括边缘、方向、速度、形状等。数据损失没后融合那么多,算力消耗也没前融合那么庞杂。

  划重点:BEV+Transformer,为数据融合按下快捷按钮。

  有没有发现,无论是中融合,还是后融合,都需面临一道关卡,那就是异构数据带来的坐标系转换。开发人员为了解决这个问题,往往是将摄像头的2D信息转换为3D。

  这也就引进了一种全新的3D坐标系——BEV

  鸟瞰视角(Bird's Eye View,简称BEV)是一种从上方观看对象或场景的视角,就像鸟在空中俯视地面一样。在自动驾驶和机器人领域,通过传感器(如LiDAR和摄像头)获取的数据通常会被转换成BEV来表示,以便更好地进行物体检测、路径规划等任务。

  传统的摄像头采用的是“透视原理”,会出现遮挡、掩盖等现象,而BEV视角就像日常用车时使用的360°全景倒车影像,看得清清楚楚,且没有遮挡。

  此外,BEV空间内的感知任务,在精度上也有优势。

  摄像头是不具备深度信息的,采取2D感知时,面对远处的物体,很难做到精确距离的识别,但在BEV空间内训练模型,感知结果会更加准确,同时还能很好地应对Corner Case, 如复杂道路状况、狭窄或遮挡的道路等。

  但问题还是有,摄像头和激光雷在识别时,都以时间上断续的帧为单元,并没有设计跨越时间尺度、Frame by frame的时域网络,这也就导致了其没办法完全利用时序上的有用信息。

  这两年,随着AI深度学习的兴起,Transformer被应用在BEV空间转换、时间序列上,形成了一个端到端的模型。

  Transformer强调注意力法则,在意数据之间的内在结构和相互关系,用于提取多模态数据中的特征,从而有效地识别和定位环境中的障碍物。

  有这么一个比喻,引入Transformer后,就像做饭请了一位资深的厨师,他就站在旁边看着你做饭,告诉你各种流程,具体根据你要做的菜品,指导你分配不同比例的油盐酱醋,从而端上来一份美味佳肴

  03

  关于端到端

  大模型的出现让这个端到端再次映入我们眼帘,早在2017年第一次做端到端。

  当时的端到端主要是基于前视相机的图片输入进行神经网络训练,然后直接输出控制指令。从实车的表现来看,稳定性并不好,脆弱到车上多上两个人就会影响他的稳定性。

  因此,后来模块化的自动驾驶技术算法路线占据主导并一直延续到今天。但大模型貌似要改变这种局面,什么感知、融合、决策、规划、控制,你们都别干了,我一个人儿来吧。而业界一直对深度学习参与决策、规划、控制功能的实现存在疑虑,因为它是个“black box”,可解释性太差,出了问题都不知道咋出的,尤其是对于规控这种安全强相关,守着自动驾驶系统安全关的模块,是绝不能交给一个黑盒子的。不然,车跑沟里都不知道谁干的。

  目前大模型的应用主要在感知和预测部分,但是慢慢向决策、规划渗透,但是个人觉得真正实现端到端需要时间,但是作为算法开发人员还是要抱着开放的心态去拥抱大模型,拥抱新技术,不断把新技术应用于工程实践中,才配得上“技术人”这个称号。

  城市NOA的方案对标

  说了这么多,还是对标一下头部车企的方案,这样大家有更具象的认识:

  从上面这几款车型来看,不难发现以下几点:

  1)整体方案上,目前基本都处于从“重地图,轻感知”向“轻地图,重感知”过渡的阶段。

  2)传感器配置上,基本到城市工况下都引入了激光雷达,安装位置都是在前方;摄像头的布置可以说是全覆盖:4个环视、4个侧视、1或2个甚至3个前视;毫米波雷达基本采用5R的方案;最后就是12个超声波在这样的车上基本是标配,但更多的是用于低速泊车。

  3)算力方面,很明显:重地图方案所需的算力很少,而反观重感知方案的算力需求差不多300TOPS起步吧。主要是激光雷达和图像的处理需要很大的GPU算力支持,不然没法“重感知”。

  4)实力方面,华为是:“全栈”+“遥遥领先”,人家是激光雷达自研、芯片自研、控制器自研、地图自己搞、软件算法自己开发。试问:这一块,还有谁?

  04

  写在最后

  从HWA到NOA,从L1到L4,自动驾驶技术在不断进步,自动驾驶行业也在不断发展,自动驾驶人也在不断成长。站在当前的时间节点,自动泊车、高速领航、城市NOA、自动驾驶早已不是新鲜和令人兴奋的词语,自动驾驶、对于汽车行业,也对于自动驾驶人。

  1、场景创新

  对于自动驾驶产品,或者是对任何的产品而言,创新永远是这个产品不竭的生命力。如果说当有一天汽车不再带给人们新鲜的体验,而仅仅是一个将人从A点运达B点的工具时,可能汽车就走到生命的尽头,而当初的从业者可能已经失业。

  自动驾驶诞生的初衷是解放驾驶员的双手,也就是利用汽车人工智能(AI)来“模拟人驾驶”的过程。城市NOA的使命便是服务于这一初衷。应用场景的不断创新和和迭代,从最开始的仅仅是前方碰撞预警、车道偏离预警,到后面的车道保持,自适应巡航,再到今天高速领航辅助、城市领航辅助,场景创新和扩展不断推进,从而解决用户的需求,用户的痛点被解决,体验不断向好,而技术也随着场景的创新而不断进步。

  2、找准定位

  自动驾驶开发是一个复杂的系统工程。涉及到多学科、跨专业,其中包括软件、硬件、芯片、工程、法律法规、算法、安全等等。纵观目前的自动驾驶行业有很多公司,有传统OEM、有科技巨头、有造车新势力、有自动驾驶科技公司,有芯片公司、有传感器公司、有传统Tire1、有工具链公司等等;自动驾驶的应用场景也重要很多:高速公路、城市路况、封闭园区、机场接驳、矿山、地下停车场等等;自动驾驶的载体有很多:乘用车、货运车、客运车、摆渡车、物流车、清扫车、采矿车等。如何在这样大的自动驾驶生态圈中找准自己的定位很重要,我们不可能都做、也不可能都擅长,因此必须找准自己的优势并且将其发扬光大。

  主机厂还是要安安心心做整车,做顶层设计,无论自动驾驶技术如何演进,我想最终它的呈现主体也离不开整车。作为生态圈中最接近终端消费者的企业,主机厂应该发挥自己的整车集成能力和超前的行业洞察力,引领自动驾驶行业的发展。

  对于科技巨头还是不要瞎折腾,车不是那么好造的,尤其是互联网大厂,搞网页和搞汽车不一样,虽然互联网的敏捷开发,扁平管理可以快速实现产品的迭代,但是汽车研发和汽车电子研发还是要遵循“V”流程,要从需求到开发再到验证形成研发闭环,这样才能保证产品质量。因此,从企业层面就需要踏踏实实做充分的市场调研,做长期的产品战略规划,做整车需求场景分析,做功能安全,抓生产质量……这样才能造好车,而这些恐怕不是互联网公司擅长的事情。

  传统Tire1在自动驾驶的大生态里还是保持自己在一级供应商中的位置,抓住对自动驾驶零部件的核心研发能力,尤其是ECU的开发经验。现在很多主机厂想要自研智驾系统、自研域控,然而相对于Tire1做ECU开发可谓是经验太少,因此在保持自身优势的前提下分自动驾驶一杯羹才是王道。

  因此,行业定位可以有很多选择:OEM、Tire1、Tire2、工具链公司,场景可选也很多:封闭园区、开放道路、停车场、高速公路、载人、载物等等,总之一句话:抓住机遇、找准定位、扩大优势,才能挣大钱!

  3、商业闭环

  2023年5月5日,自动驾驶卡车公司图森未来收到了纳斯达克的退市通知。作为曾经的自动驾驶第一股,自动驾驶行业独角兽的存在,其退市新闻一时间激起了人们对”自动驾驶还能走多久“的思考和讨论。虽然关于图森的此次退市有这样那样的背后原因:高层动荡、内部矛盾等等,但是归根到底只有三个字:不赚钱。确实,从谷歌的第一辆自动驾驶汽车上路测试(或许也是全球第一辆真正意义的自动驾驶汽车)至今自动驾驶公司还没有形成自己真正的商业闭环模式。之前有人说是商业模式没有被探索出来,有人说是技术发展瓶颈,也有人说是法规政策跟不上行业发展,但是不管是哪种原因最终都是无法形成商业闭环:要么造不出来、要么卖不出去、要么卖出去不赚钱、要么卖出去用不上……

  回首这些年的自动驾驶资本市场,从15年-18年的一路高歌,到后来的20年的冷淡,再到2021年的资本小高潮,22、23年又慢慢回归了平静,大家慢慢冷静下来了。阿里达摩院整合自动驾驶资源到菜鸟团队,百度合并L4和L3自动驾驶团队,福特放弃L4研发…曾经各个主机厂纷纷喊出:“2020年实现L4自动驾驶量产”的口号,现在看来距离2020年已经过去近4年了,而L4的量产之路却遥遥无期,当初的豪言壮语化作现如今的“骨干现实”。既然看不到L4/L5的彼岸,那就回归到L1L2的量产阵营来。于是HWA、NOA、 NGP、 L2+、 行泊一体纷纷上车,L2、L2.5、L2.9、L2.99都出来了,但是没有人再敢提L3,更别说L4/L5了。不管是L2,L2.5、L2.9还是L几那是主机厂的事,是开发商的事儿,用户不关心,也不懂。用户只关心:有啥用?多少钱。因此,不管叫什么名称,只有两个字最重要:量产。量产了,就意味着可以面向市场了,这样才能形成产品价值,形成商业闭环。有了钱,再用低阶产品反哺高阶产品的研发,这样良性循环不断迭代,总有一天会实现真正的L5。

  4、充满热忱

  对于每个人来说做什么事情都离不开热情和激情,而对于一个行业而言同样如此,如果当初的热忱慢慢被现实浇灭并不再复燃,那最终这个行业也将慢慢走向灭亡,自动驾驶也是这样。因此不要急于求成,不要指望一个技术能立刻带走“老司机”,激光雷达不能、高精地图不能、大模型也不能……无论何时都请相信时代在发展,科技在进步,生活在变好,自动驾驶的发展当前确实遇到了一些问题,技术的瓶颈也好,资本的冷落也好,政策的退坡也好,但都不会阻止汽车智能化的脚步。请记住没有不流血的革命,没有不转弯的公路,自动驾驶行业的跌宕起伏,但最终也将螺旋上升到达山顶!

  榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。

相关阅读