![自动驾驶BEV感知算法指南](https://wfqqreader-1252317822.image.myqcloud.com/cover/16/53288016/b_53288016.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3.3 基于多层感知器的方法
基于多层感知器(MultiLayer Perception,MLP)的方法利用多层感知器作为复杂的映射函数,将输入映射到不同模态、维度或表示的输出上,以实现从透视视角到BEV视角的转换。
为了消除相机校准设置中的继承感应偏差,一些方法采用MLP来学习相机校准的隐式表示。例如,视图解析网络(View Parsing Network,VPN)选择了两层MLP,利用全局感受野的需求,通过“关注-映射-重塑”的过程将每个PV特征图转换为BEV特征图,然后添加来自不同相机的所有特征图以进行多视图融合。金字塔占用网络(Pyramid Occupancy Networks,PON)则是基于网络对于将特征映射到BEV的大量垂直上下文的需求,利用特征金字塔提取多个分辨率的图像特征,使用MLP沿高度轴折叠图像特征并沿深度轴扩展来执行视图变换,如图1-9所示。
![](https://epubservercos.yuewen.com/91F949/31752005803755606/epubprivate/OEBPS/Images/22_01.jpg?sign=1739672863-1Yna9Xyl94ChZdTKnS0QGIdfJtwuyolL-0-54cd2268108ab194c6331f0c93733e7e)
图1-9 PON按列将透视图特征转换为鸟瞰视图特征
基于MLP的方法利用多层感知器作为映射函数,实现了视角间的转换,为自动驾驶等应用提供了重要的感知能力。