VAD: Vectorized Scene Representation for Efficient Autonomous Driving 解决了什么问题?相关工作感知运动预测规划 提出了什么方法?概览1. 矢量化的场景学习矢量化地图交通参与者的矢量化运动 2. Planning via Interaction自车-其它交通参与者的交流自…
Alignment与Correspondence,用于量化衡量MLLM中视觉特征的视觉语义对齐与视觉结构程度的方法 FesianXu 20241006 at Wechat Search Team 前言
在多模态大模型(Multimodal Large Language Model, MLLM)中,视觉特征就像…