本文研究了汽车行驶工况的构建问题。主要创新点在于结合了随机搜索和 聚类分析法,并使用径向基核化主成分分析和 BIRCH 层次聚类方法进行改进, 最后首次提出使用自编码器直接优化已有工况的特征参数误差的方法。
问题一:我们对原始采集数据中的不良数据进行了预处理,主要包括 (1) 针 对 GPS 信号丢失导致的时间不连续问题,我们进行了数据插值和分片,共计增 加 3480 条数据,删除 144 条数据; (2) 针对加减速度异常问题,我们首先用插值 结果替换异常结果,之后若仍具有异常结果则直接删除,共计删除 24051 条数 据。 (3) 针对长期停车和低速行驶情况,我们按照怠速情况处理,当怠速时长超过 180 秒时,仅保留后 180 秒数据,删除剩余数据,共计删除 20482 条数据。经过 数据预处理之后,我们将得到可用于此后汽车行驶工况曲线构建的最终数据集, 共计 455267 项数据记录,其中各文件记录数分别为 175152、 139294、 140821。
问题二:我们对问题一产生的多个分片进行运动学片段提取,主要包括 (1) 删除未以 0km/h 为起始或终止的片段; (2) 删除行驶持续时间 (不包括怠速时间) 小于 20 秒的片段。最终我们提取出 2088 个运动学片段,其中各文件片段数分别 为 845、 648、 595。
问题三:我们根据汽车行驶特点,构建了包含 11 项特征参数的汽车运动特 征评估体系。为了构建具有代表性的工况曲线,首先使用了运动学片段随机搜索 (选择) 法,得到了最小误差率为 4.36% 的工况曲线。但该方法候选空间过大且 结果存在较大随机性 (多次随机搜索的所有结果的平均误差率为 14.81%)。其次 我们实现了目前广泛被使用的聚类分析法,它通过将运动学片段特征进行聚类, 并选择最靠近聚类中心的运动片段来组成行驶工况。该方法有效减少了计算量, 但得到的工况曲线特征误差较大,为 9.40%。
考虑前两类方法的缺点,我们提出以聚类中心的邻域作为候选集,再在其中 进行带约束的搜索,从而寻找最优的运动学片段组合。该方法能有效减少搜索空 1间,并增加寻找到优化解的概率。实验表明该算法显著优于目前已有算法,将误 差率由 9.40% 下降至 3.18%。
针对降维与聚类方法,我们对主流的线性主成分 (PCA) 与 K 均值聚类结合 的方法进行了创新性改进。由于运动学片段的复杂性,这里使用了径向基 (RBF) 核化主成分分析,对原始特征进行非线性降维。之后通过对离群点和孤立点更鲁 棒的 BIRCH 层次聚类分析,进行运动学片段的分类。该方法进一步将误差率由 3.18% 下降至 2.94%。
最后,我们首次提出利用生成模型自编码器 (AutoEncoder) 对上述结果进行 行驶工况再优化,该算法利用自编码器可重构输入的特点,在保持原工况曲线整 体趋势不变的同时,优化生成结果中重要的特征参数,最终使得生成的曲线的误 差率再次显著下降至 2.43%。
关键字: 运动学片段法,核化主成分分析,层次聚类,自编码器,深度学习
D19100010050链接:https://pan.baidu.com/s/1hAq4Ape0WKHAR0uHrLZ9SQ
提取码:7hvt