6月10日讯 主持人:首先介绍一下,现在介绍采访的是肖志光,我们自动驾驶中心产品开发的,总监。整个从自动泊车到停车场记忆泊车的系统是光哥指导开发的,包括我们的光哥也是可以说是小鹏汽车的创始级的员工,他是我们公司的十号员工,对于我们研发体系的搭建,肖志光同学尽了很多的努力。就着今天的主题做一个专访或者QA一下都可以,有一些媒体老师体验过停车场记忆泊车的功能,对我们功能技术开发的背景或者使用体验包括整体的研发体系等等这些都可以跟光哥大体交流一下,互相探讨、学习一下。
提问:今天体验的过程当中的问题,记忆泊车需要记好路线之后然后需要开入停车场回到启点才能开始之前路线的泊车,我想问一下目前是因为什么需要出这个停车场,以及后续在什么条件下不需要做,可以直接在停车场内开始?
肖志光:模拟普通的用户上下班或者是回家的场景,我们做了一个假设,首先用户需要学习路线,学习完以后一般用户不会马上用这个功能,而是上班去公司或者下班回家进入车库才会启动记忆泊车,所以需要出去的过程,其实技术上不需要一定出去的。目前产品设计是满足大家正常上下班或者通勤的场景,所以出去一下再进来有一个场景的感觉,我们平时做测试的时候也会没有出停车场到启点也能开启记忆泊车。
这个地方不是一个技术的问题,是一个产品设计的问题。
提问:您好,关于语义地图这一块能不能多讲一块有什么技术难点这些地方多讲讲。
肖志光:关于语义地图这一块是我们记忆泊车的一项核心技术,这个里面其实是涉及到两块我们认为有突破性的技术。一个是视觉识别的能力,视觉的识别能力除了以前传统的识别车辆,车位线框这些元素之外还有墙壁接地线、柱子、行人等等之类的,后面还会有悬空物的识别。
除此之外,语义地图定位技术,我们认为也是一个比较有突破性的技术,因为我们相当于在停车场里面没有GPS信号也没有高精地图的前提下,使用摄像头视觉技术,此时毫米波雷达在停车场复杂环境下基本不可用,最终实现了厘米级的定位精度,定位稳定性非常高,一旦定位上以后几乎不存在定位失败的情况。
提问:有一个学习,要先学习才能用这个功能,学习目前来讲识别不了雪糕筒,我看到这回OTA更新了能够,NGP能够识别在道路上摆放雪糕筒这样一种能力。这两个之间没有互通,在停车场也能够实现这个雪糕筒是因为光线环境还是什么?
肖志光:不是这个原因,雪糕筒在停车场环境也能识别,只是说没有做图形显示。
主持人:我理解的是现在对于雪糕筒车也是有反应的,只是在SR上还没有做那个元素。
提问:我想问一下这次的VPA我看到现在大家有200多人的内测,大概什么时候开放给用户?
肖志光:应该是这几天,很快。
提问:是限于P7的用户吗?
肖志光:P7,购买XPILOT 3.0的用户。
提问:因为之前我们测试的车里面基本上辅助驾驶的功能都是不能识别车道里面的雪糕筒,没有这个能力。小鹏做了,它在识别雪糕筒方面有什么难点?小鹏现在才做以及其他家现在做不了这样的能力,背后有什么技术难点?有什么难度?
肖志光:雪糕筒目标相对其他目标比较小,是细长的物体,所以在识别上要求摄像头的分辨率足够大,其次是它需要跟其他的物体能够区分,这里面容易产生误检,这方面需要做大量的工作。
一个是能够识别出来,另外一个是不能够与其他的物品能够产生干扰,造成误检,这样就会造成在停车场环境下如果遇到雪糕筒会误刹车的情况。
提问:咱们泊车的功能开发大概是一个多大的团队,大概分成哪些模块,想问一下在泊车场景下是怎么进行功能的拆分和定义。
肖志光:泊车的团队大概是150多人,软件人员有100个人左右。
提问:泊车这一块里面的模块是分成哪几块?包括感知、建图,大概分成哪几个模块。
肖志光:这个跟其他的自动驾驶功能是类似的,也是分为感知、决策规划等这些模块。另外关于泊车这一块大家应该能感受到从我们2018年刚推出来到现在是有节奏去推出各个子功能,刚开始是平行泊车,后来是垂直泊车,后来是语音泊车、钥匙泊车,这是围绕着车位附近的泊车功能。
最近推出的功能有一个比较大的升级,就是现在的记忆泊车。记忆泊车大家已经体验过了,首先用户可以教车辆学习一条行驶轨迹,第二次进入停车场的时候,车辆能够接管驾驶员操作,自动驾驶到停车位,然后倒车入库,相当于一个“私人代驾”。
提问:P5之后功能会不会比P7的功能表现更强一些?
肖志光:问题背后的逻辑是哪方面?P5、P7都是用的几乎同一套硬件系统,在性能上会有比较大的提升。加了激光雷达,因为他是在车头位置,所以会识别更早、更精准识别目标,反应速度更快。
提问:对于一个用户来讲,现在的问题是现在买P7将来买P5会不会体验上差很多?
肖志光:体验上不会有非常大的差别,性能上会有细微的差别。
提问:好的,谢谢!
提问:咱们整个100多人的团队在开发的过程中有什么比较有挑战的事情?
肖志光:关于挑战这块分几个维度,首先作为一个全栈算法自研的企业有没有决心做这件事情?这么大的团队开发这一个功能首先要有足够的决心投入到这个事情上。因为投入意味着资源要往这方面倾斜,人力要倾斜,费用也要倾斜,还需要冒非常大的成败风险。需要要坚定这个信念,我们做了一些交流,有的主机厂在这中间是比较犹豫了,小鹏汽车一直坚持做全栈算法自研,这一块是第一个挑战。
另外我们在那么短的时间内做这件事情,这个功能大概花了1-2年时间,把这个功能由一个Demo开发成一个可以交付给用户的产品,这个里面依托了我们以前在G3上的量产经验,以及在P7上量产的经验,利用前面成功的经验去组织100多个人的研发团队,按照我们探索出来的产品化开发流程把产品开发出来推向市场,这是第二个挑战。
提问:外界关于小鹏的泊车评价一直都很高,觉得泊车做的好主要是抓住了哪些关键点?一个是刚才讲到可能投入比较大、比较多。
肖志光:这个要回溯到2017、2018年对行业做的一些调研。我们发现整个辅助驾驶分为三个系统,一个是主动安全系统,另外一个是辅助驾驶系统,也就是行车系统,再一个是泊车系统。我们发现泊车系统当时在行业中的发展不是那么成熟,我们看到了其中很多用户的痛点,之前的泊车系统经常找不到车位,且操作不便捷,那么这些地方我们可以去攻关,去真正解决用户的痛点。
其次我们一直坚持我们的全栈自研的开发,做了大量自研和探索的工作,为后面能够持续不断快速迭代、解决用户痛点打下了很好的基础。经过这两个点我们这个自动泊车的功能才会在行业里面有领先的地位。
提问:我们测试的规模有多大,多少车、多少停车场?你们会开放吗?是全面开放还是分批次的节奏?
肖志光:我们在全国各个区域20多个城市做了大量的随机测试,车辆数量不少于10台。
主持人:我们现在的规模政策都是在同一个时间点上的全量推送,因为各地移动供应商的限制或者说因为一些信号流量的限制,用户收到包的时间太一样,但是我们是统一全量推送的。
提问:刚刚讲到主动安全泊车和行车是并行的,现在有一个趋势是大家想把这几个功能做到一起,在一个系统里面能够跑完,从城市道路到泊车流程,如果要做这样的工作是不是意味着这三套系统要重构?因为我了解泊车有泊车的几个感知,行车有自己的行车,这在感知的规划下怎么做?
肖志光:这个问题问得非常好,小鹏汽车针对这个问题在很早以前,一开始做这个事情的时候做了这方面的布局,我们的硬件系统一直是秉承一套系统去做这件事情的,所以我们的传感器和执行器的数据都是可以共享的。
为什么小鹏汽车自动驾驶都是三个场景同时在发力,这得益于我们的硬件系统不是割裂的,无论是泊车、行车还是主动安全系统,其实在硬件上来看是同一套系统。
为什么软件上会有所区分?因为应用场景和需求不太一样。我们需要三条线同时开发,以便有效率的同步迭代这三个场景的功能。不同的场景有不同的特点,在行车的环境下我们,是要解决的是车辆、车道线的问题。在停车场除了解决这些问题还要,解决十字路口、横穿的车辆和行人、逆行车的问题,所以在软件上会产生差异化的表现。
提问:所以您的意思是说放在小鹏case上城市高速泊车不需要统一开发的?
肖志光:硬件系统本身就是一套系统,我们只要把场景过渡的区域开发出来,打通场景就可以了。泊车跟行车场景之间还有一个场景的,就是从停车场出来到道路上会有小区收费站、小区边缘道路的场景,这些需要花时间打通。
提问:今天在做测试的时候之前不是有一个考试,那个考试第一道题说在哪些场景停车,我选错了没有选露天停车场,我以为可以停,为什么露天停车场不可以?
肖志光:这个是开发节奏的问题,不是一个技术的问题。我们后面也会释放露天停车场的场景。
提问:预计在什么时候?
肖志光:目前不方便透露,我们需要做足够的测试,技术上是已经有了。
提问:您觉得记忆泊车这件事情它的终极意义是什么?现在使用小鹏算所有的里面最快的,但没有自己来的更快,我也需要坐在车上,它的终极意义是什么?
肖志光:这个涉及到产品演进的技术路线、演进策略的问题。小鹏汽车做这件事情终极目标是要实现无人驾驶,但是在这过程中作为一个企业怎么持续给用户带来价值?
刚才提到了最开始开发停车位附近的自动泊车入位功能,可以解放用户泊车入库的问题。
其次,扩展到整个停车场,先推出记忆泊车,可以解决用户从停车场入口到停车位这一段驾驶操作的问题,会解放他们的操作,用户可以提前收拾自己的东西,准备下车活动都可以提前去做。再往后会进一步演进其他的功能,这些功能暂时不方便透露,但一定会给用户带来新的价值,慢慢演进,到,终极的目标是驾驶员把车停到停车场入口,人可以下车,车可以无人驾驶到停车位停车。
提问:我们现在保存的地图是什么样的地图?是一条路线还是一个完整的停车场的地图?
肖志光:我们这个地图是一个语义地图,是把停车位、墙壁接地线、车道线以及柱子等信息记录下来,同步还会把车行驶轨迹记录下来,产生这样一个有物理意义的场景构建。
提问:您提到不同于1024的地图,这个可以讲一下。
肖志光:1024是视觉SLAM,是记录图片里面各种特征,这些特征人是不可以理解的,且对拍摄角度有一定要求,没有3D空间的概念,所以定位稳定性不是很好,保存了大量图像的细微特征,存储空间特别大,而语义地图很好的解决了这些问题,可拼接,可更新,存储空间小。
提问:解决起来可能会有哪些特别难的地方?举个例子,比如说是行人比较多、光线比较暗,类似的问题大概介绍一下。
肖志光:刚才我已经讲了两个点了,在停车场的环境没有GPS没有高精地图是很难的,我们用了语义地图及定位匹配的算法解决这个问题了,我就不赘述了。
其次从场景的角度可以做一些剖析,在停车场里面有它的特点,首先路口非常多,我们经常会描述停车场的环境是一个狭小空间的环境,在这种环境下会经常出现会车。狭小空间的会车不但要把车辆识别出来还要准确估计车的姿态,因为离的非常近,姿态会影响双方的行驶。
其次路口的通行。路口的通行有三种情况,可能是直行,可能是左拐,也可能是右拐,我们需要准确预测这些车辆的行为,做出正确的决策进行通行。
另外在停车场会出现车辆出库、入库突发的情况,我们也需要对这些场景做比较合理的处理。
再次在某些场景中行人非常多,有些停车场会有超市入口,超市的门口一般不是一两个人横穿道路,而是一大波行人以各种情况横穿道路,我们需要精准识别行人,预测行人意图并且决策车辆驾驶行为。
提问:另一条技术路径其实是依赖于停车场本身的基础设施的建设,您怎么看这种路径?
肖志光:我觉得这是两种不同的技术路线,改造停车场也是想得到室内的精准定位信息。我们考虑到改造停车场会增加推广的难度,我前面说到了我们更愿意秉承去解决用户痛点的思路寻找我们的解决方案,所以我们倾向于通过车端解决室内定位问题的技术路线,以便产品快速推广,快速被消费者接受,所以关于停车场改造不做太多的评论。
提问:关于ETS的方案还是以后停车场的基础设施不管是政府去推动还是有商业机构来做这件事情,如果真的能够有很强的改善,能够把他们的数据引入到我们这套系统里面的继承库,可以这么理解吗?
肖志光:停车场的技术路线跟目前的技术路线不冲突,如果停车场改造完以后有更多的信息可以提供给我们,我们只要按以后定的停车场跟车的信息交互的接口,按这个协议做好接口的解析可以获取停车场的信息以便能够提前知道我们整个停车场的停车位的情况的信息,哪些停车位有停车,哪些停车位没有停车,在传感器没有检测到之前能够规划路径,有效率停到空车位的位置,所以这个不会冲突的。
提问:今天上午的时候还有一个问题是我感到有一点点陌生,我出了三次地库,每次会出现不一样的问题。第一次没有路,要么只能出去要么是只能逆行。
主持人:走远一点路线,她想多体验一下。第一次走到断头路,其实有车位可以用的,胡老师想多体验一下。想多走路线,因为是断头路,就重合了,没有车位的话需要继续掉头出去,这样路线重合或者有很长的倒车过程。或者停车场特别大,走迷路的路线又重合了。
提问:理论上是交叉的关系,但是可能在交叉的时候打了一点点的方向导致又重合了,但其实并不是走原路径,我只是想过去。第三次没有路,要不是出去,要不往左拐是逆行,右拐出不去,所以好几趟,设计的逻辑是什么?我在体验的过程中如果抱着尝鲜的感觉是没有关系的,如果在日常使用过程中会有一些小问题。
肖志光:您刚才说有两个关键点:
第一个关键点,在学习路径的时候不能倒车,倒车不能超过1米。
第二个关键点,学习的路径不能有重复的路径。
这是两个关键点。
我们为什么做这么一个设计?因为我们目前推出的是记忆泊车,这个里面我们在做产品设计的时候会提倡一点,我们要提升我们的通行能力,通行的效率。如果在学习的过程当中倒车可能会在第二次记忆泊车的时候会有一个这样子不太好的体验,虽然不一定会倒车但是可能会在那个地方停顿一下,这个体验不是很好的。
作为用户来说不是尝鲜,不是去体验会找最近的路径停到家附近,不会开两除非是刻意尝鲜。为了提升通行效率和避免冲突的情况,所以给优化掉了。
作为普通用户,如果当成一个正常的工具来使用一般不会出现这两种情况,不过这个事情当然后面也会考虑到尝鲜去做一些优化。
提问:有一个情况是如果我自己家的停车位肯定是会知道车库的车位在哪,今天的特殊情况是我抱着尝鲜的角度去,有时候商场的停车场和写字楼的停车场停车位不会很好找,所以可以路会重复经过。
肖志光:也会有一个问题,在商场或者是办公楼想去停车先要教它一遍,教它一遍不能把所有的转遍,第二次来的时候都要沿着路寻一遍车位,再找空车位停进去,总体验上不是很好。您提到的点是沿途找车位,有一个随机路线的沿途找车位,在后面的功能里面会推出来满足这个应用场景。
提问:所以现在更适合的场景是我在家里找我自己家的停车位?
肖志光:是的,上下班的。去公司车位相对来说停的区域比较固定也可以去停。
提问:我们怎么在保证VPA使用的安全,我不知道有没有一些指标和标准,尤其停车场比如说有一些车,会有婴儿车,会有婴儿。他们对于停车场小孩子的安全是比较关注的,你们在这方面有什么样的标准?
肖志光:小鹏汽车非常重视安全安全这一块,针对这一块做了大量的开发和测试的工作。在内部我们会从不同的层级,从算法模块到整个功能设定了非常多的有关安全、体验、性能相关的KPI。通过我刚才提到在全国各地做的各种场景的测试,拿到有关统计的数据得到KPI列表,我们会对KPI进行评审,去看哪一块有什么问题,需要怎么去改进?所以产品是经过大量测试的结果。
所有的KPI加起来有上百个KPI指标。
提问:关于这个问题,我们方不方便说更细的,针对什么样的情况做了什么样特定关于产品的设计?
肖志光:这一块不是特别方便透露,我可以举一个例子。比如刚才提到的小孩这个场景,我们其实从算法设计端专门针对小孩采集了大量的样本数据对算法模型进行数据训练,并且做了很多的针对性的场景测试。
提问:记忆泊车功能它的开发周期大概是怎么样的?什么时候立项、交付?
肖志光:开发周期是1-2年的时间。当然这个开发周期是得益于前面G3和P7的成功经验以及搭建起来了这套产品开发流程。
主持人:假设如果在商场或者在写字楼没有自己的固定停车位,这个时候可能记忆的车位被人占用,车开到那个区域之后系统可以识别周围的车位,有车位可以转到自动泊车的过程,如果车位没有了,会提示。所以我觉得在商场或者写字楼多使用、体验也不会比在家里停车(的体验)差太多。
大家如果没有问题的话,我们就结束了。感谢各位老师提的宝贵建议,包括这边也会做一些后续的优化提供更好的(产品)。