第16届研究生数学建模竞赛C题——视觉情报信息分析(5)

视频图像信息分析是计算机视觉研究中非常重要的一部分,它的目的是依据已知的图 像信息,通过数学模型提取出用户感兴趣的物体信息,如物体的大小、距离、速度等。本 文研究了在单目视觉下的单幅图像、平面视频、立体视频下的距离信息分析技术,通过射 影几何、 透视投影、 灭点检测、相机位姿估计、 RANSAC、 SafeUAV 等算法,完成对典型 应用场景下视频图像信息分析。

针对任务一: 单幅图像下的距离信息分析。 单幅图像可以通过求解灭点利用透视投影 的交比不变性得到结果,也可以通过灭点求解相机内参,得到单应矩阵进行求解。 因此, 灭点的求解对于单幅图像的距离分析至关重要。 本文分别采用了基于霍夫变换的灭点检测、 基于 Gabor 小波变换的灭点检测和线性回归法进行单幅图像下的灭点求解,并选取出最优 的检测结果。 基于求解出的灭点, 本文分别利用了两种不同的方法进行求解并进行交叉验 证。其中, 直接几何法利用射影变换中的交比不变性直接求解物体的距离,而间接几何法 可以通过 EPnP 相机位姿估计算法求解单应矩阵, 从而得到像素坐标系与真实坐标系之间 的对应关系。

针对任务二: 平面视频下(高速上拍摄) 的距离信息分析。 相机在拍摄的过程中难免会 存在一些晃动或者偏移,这也就造成了视频中的抖动。 为了去除视频抖动影响,根据原视 频产生经过运动补偿过的视频序列,我们采用随机抽样一致 RANSAC 算法, 利用帧间的 信息来计算帧的全局运动参数, 进而去除视频的抖动, 从而得到运动稳定的视频图片序列。

与任务一不同,任务二中的视频中含有的真实尺度信息较少,很难得到足够多的像素坐标 与真实坐标对应关系进而求解单应矩阵。因此我们通过寻找几何约束对实际问题进行建模, 利用交比不变性得到对物体距离和尺度的估计。

针对任务三:平面视频下(高铁上拍摄)的距离信息分析。 与任务二相同,我们用 RANSAC 算法消除视频中的抖动。高铁上拍摄的视频由于缺乏明显的尺度信息, 通过广泛 的资料查找,我们挖掘出了视频中隐含的部分物体的真实尺度。进而利用地平线上灭点的 性质, 通过几何约束对实际问题进行建模,利用交比不变性得到对物体距离和尺度的估计。

针对任务四: 立体视频下的信息分析,本文采取了基于深度学习的无人机飞行高度估 计算法 SafeUAV 对视频中的深度和无人机飞行高度进行估计。 SafeUAV 算法对无人机拍 摄视频中的深度信息进行预测,进而得到图像中各个像素点的深度图。基于 SafeUAV 算法2 提供的深度预测, 以及灭点求解出相机内参, 我们进一步通过层次分解和射影几何方法求 解单应矩阵, 将等高度的单位距离网格可视化, 从而得到了立体视频下的物体距离和尺度 估计。

最后,本文对所建立的模型给出了评价和改进的方向。

关键词: 交比不变性, 相机位姿估计, 霍夫变换, 单应矩阵, RANSAC 算法, 深度学 习, SafeUAV 算法

C19100030017

链接:https://pan.baidu.com/s/1c-ZrbsUaBpCvSb0dWdbeOA
提取码:o37k

 

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注