2023年,在硬件集成与软件算法方面,激光雷达行业同样取得了长足进步。本篇文章,数字绿土从激光雷达硬件发展方向,软件算法研究重点,未来技术展望3个维度进行梳理与总结,为关注激光雷达行业应用的从业者们总结过去、展望未来提供参考。

 

硬件

小型化、传感器融合

 

近年来,激光雷达硬件的发展出小型化、轻型化,传感器融合、数据处理能力快速提升的趋势。

包括Velodyne、RIEGL、Cepton、Aeva、导远电子等,均在便携性和即插即用方面取得了突破。其中Cepton发布了尺寸仅为150×24×90mm的小型汽车激光雷达Ultra;导远电子推出了整合固态激光雷达、MEMS微镜模组和GNSS模组的轻小型车载混合LiDAR系统。通过减小设备体积、降低重量,LiDAR系统将更加适用于各种场景,包括自动驾驶平台、轻型机器人和消费级设备。

其次,固态激光雷达(solid-state LiDAR)技术的崛起,通过减少运动部件,提高了系统的可靠性和耐用性。高分辨率、高精度LiDAR系统的推出,使得可以更清晰地捕捉目标物体的形态和精细结构。禾赛科技、速腾聚创、Cepton、SiLC Technologies均研发了超高清超远距激光雷达。

为了应对不同探测应用需求,制造商开始整合多光谱激光雷达、LiDAR和光学影像等多种传感器。这种多模态的数据采集方式提高了系统探测能力,使其能更全面地捕捉目标物体信息。对于要求高精度和多维数据的应用场景,如自动驾驶和环境监测,具有重要意义。

随着机器学习技术的发展,LiDAR系统能够更智能地处理和分析原始数据,从而实现更高效的目标感知和信息提取。万集、Luminar均推出了基于LiDAR和人工智能的自动驾驶解决方案。这一趋势对于加速数据处理、减少人工干预具有重要意义,尤其是在大规模数据采集和实时应用场景中具有重要价值。

综合而言,LiDAR硬件在轻型化、多传感器融合、自动化数据处理方面不断发展,不仅推动着LiDAR技术的不断升级,也为新兴应用场景的开发提供了更为丰富的硬件工具和解决方案。

 

算法

深度学习的点云配准仍处早期

多模态语义增强SLAM受关注

 

传统点云配准主要采用粗配准+精配准结合的方式。首先通过粗配准评估一个旋转平移矩阵初值,将两个位置不同的点云尽可能地对齐,主流方法包括RANSAC、4PCS等。经过粗配准后,两片点云的重叠部分已大致对齐,再使用精配准方法(ICP、NDT等)实现两个点云之间的最佳匹配。这类方法往往需要手动设置特征以区分对应关系,因此受到设计者经验和参数调整能力的影响。相比之下,基于深度学习的方法能直接从大量数据中学习高级特征表示模式,因而在描述能力和对点密度以及视点变化的鲁棒性方面更具优势。常见的基于深度学习的点云配准方法包括PointNetLK,Deep ICP,DCP,PRNet,IDAM,RPM-Net,3DRegNet,DGR等。

当前基于深度学习的点云配准仍处于早期阶段,在海量数据处理、噪声和异常值较多、跨源点云配准等场景下配准精度仍有待进一步优化;结合深度学习和传统ICP算法可保证配准精度,但需要消耗较多计算资源,难以满足自动驾驶等实时性计算的需求。

早期基于激光雷达的SLAM方案,主要采用卡尔曼滤波及其衍生算法(EKF-SLAM、FastSLAM、Gmapping、Optimal RBPF),随着计算机视觉技术进步,Lu F等人首次提出利用图优化的数学框架优化SLAM问题,通过非线性最小二乘方法来优化建图过程中累积的误差。在此基础上,Google发展了Cartographer开源方案,其核心内容包括融合多传感器数据的局部子图创建以及用于闭环检测的扫描匹配策略。另外,Kohlbrecher S等人提出了Hector-SLAM方案,该方案利用高斯牛顿方法解决前端扫描匹配问题,把每一帧采集到的激光雷达数据和地图进行匹配,该方案仅有前端扫描匹配的模块,无后端优化的过程。上述算法在静态环境中精度较高,然而在动态场景中,行人和车辆等动态对象将影响扫描匹配的准确性,导致相对姿态估计出现偏差。随着深度学习技术的发展,多模态语义信息增强的三维激光SLAM技术越来越受到关注,综合利用深度学习的智能处理能力和多模态数据的场景语义信息,有助于SLAM系统分析和理解不同场景,提升环境感知能力。此外,未来SLAM系统需要发展不同设备的信息协同和分布式处理框架,通过不同传感器、不同设备的协同计算,降低单个设备的负载,提升目标感知精度与效率。

 

展望

多源多模态数据融合

新算法为数据处理降本增效

 

多源多模态数据融合,通过优势互补提供更为全面和多层次的信息,可满足多样化的应用需求,为更准确、全面地分析复杂系统和场景提供了有效手段。

多平台LiDAR数据融合:通过多平台数据整合,克服不同LiDAR平台观测角度和激光传感能力的限制,打破不同平台之间的尺度壁垒,实现对目标的三维结构信息的互补,获得更精细的空间特征。多平台LiDAR数据的结合将为未来林业、农业、电力等应用提供新的思维模式。

光谱特征与LiDAR数据融合:目前LiDAR的应用主要是提供位置信息,而随着新型多光谱激光雷达的出现,LiDAR点云已经能携带除XYZ位置信息之外的光谱特征;同时,通过融合多光谱、高光谱数据与LiDAR点云数据,可进一步扩展LiDAR数据中的光谱信息,对林学和生态科学研究和相关应用将产生重要影响。

文本描述与LiDAR数据融合:文本信息能够提供场景的属性、计量、空间关系等语义特征,而LiDAR数据则提供了丰富的几何和空间信息。通过融合文本和LiDAR数据,可以实现关系识别、复杂语义表征以及场景知识图谱的构建,有助于更全面、更深入地理解环境,并且更清晰、直观地向用户解释感知结果,提升用户交互能力。

目前已有部分大规模预训练模型,例如ChatGPT、SAM、CLIP等实现了文本和图片的自动描述与生成,未来将扩展至LiDAR数据融合,进一步增强计算机的复杂场景理解和推理能力,为自动驾驶、数字孪生等应用提供支撑。

随着点密度的不断提高,数据量也越加庞大。采用人工智能、云计算等技术缩短数据处理时间,研究基于云计算平台的高性能分布式计算技术及设计相应的高能效架构,最大程度降低硬件资源消耗和提升系统整体能效,已成为热门研究方向。

深度学习方法在LiDAR各方面应用中展现出巨大潜力,然而它提取的特征缺乏明确的理论基础,且存在一些亟待解决的问题,例如:深度学习需要大量训练数据,然而实际应用中往往缺乏多任务、多场景、高质量的数据集,未来需关注减少标注数据需求的小样本学习和迁移学习技术,研发性能更好、鲁棒性更强的LiDAR点云数据处理模型。同时,现有方法往往难以兼顾精确度和实时性;不同的任务对精确度和实时性的侧重点不同,例如自动驾驶领域对系统的实时性和准确性有着很高要求;如何兼顾精度和实时性是3D目标检测任务中的一项重点。此外,由于面向对象的不同、传感器类型的不同及观察尺度的不同,相应的算法往往具有一定的局限性,还未形成系统完善的理论算法体系,亟需发展融合多源多模态遥感大数据的多任务通用模型,提高特征融合对不同数据适应性,同时解决数据分类、场景理解、视觉问答等任务。

遥感技术的平台化成为遥感研究的发展趋势,这也对遥感、通信和电子等多学科融合提出了新的挑战。随着5G等数据高速传输手段的发展,未来将有望打破目前遥感数据的采集和处理分开进行的格局,实时处理LiDAR遥感数据,实现场景观测的自动化、数字化、信息化。