摘 要:
汽油燃烧产生的尾气排放对大气环境有重要影响。汽油清洁化重点是降低汽油中的
硫、烯烃含量,同时尽量保持其辛烷值。然而汽油精制工艺是一个多变量的强非线性、强
耦联性的复杂系统。为控制精制过程中产品的硫含量、建立汽油辛烷值预测模型和优化操
作变量降低辛烷值(RON)损失,本文充分利用线性、非线性相关分析、互信息理论、神经
网络、智能寻优算法等数据挖掘技术研究了如何降低汽油精制过程中辛烷值损失的问题。
针对问题一,依据附件二给出的“样本确定方法”对附件三: 285 号和 313 号样本原
始数据进行数据整定。经整定,两个样本原始数据中不存在残缺数据较多、全部为空值或
部分为空值的位点(操作变量),不需作数据处理; 依据变量的最大最小限幅,筛选出 8
个变量,剔除 4 个涉及样本数超过 42.15%的变量;将整定好的样本替换附件一中的对应样
本,同时利用拉依达准则剔除 4 个存在非操作变量异常值的样本。最终形成 321 个样本、
364 个变量的数据文件。
针对问题二,汽油精制工艺是一个多变量的强非线性、强耦联性的复杂系统,首先模
型一利用简单线性相关分析和偏相关分析,得到产品辛烷值(RON)和原料辛烷值(RON)的
强相关性,相关系数为 0.973。然后建立基于互信息的降维模型,将剩余变量依据与产品
辛烷值(RON)互信息值的大小排序,剔除线性相关较强的变量后,选取前 14 个变量和原料
辛烷值(RON)共计 15 个主要变量。模型二基于遗传算法—BP 神经网络的降维模型利用了
神经网络对非线性问题的良好适应性,采用二进制编码形成自变量组合,通过 BP 神经网
络计算得到产品辛烷值(RON)预测值的均方误差作为该自变量组合的适应度,经遗传算法
寻优得到最优的 14 个主要变量的组合。对比两个模型,发现两组主要变量有 8 个完全相
同,但模型一的剩余主要变量之间存在更弱的相关性,符合主要变量的独立性标准。
针对问题三,基于问题二模型一所得到的 15 个主要变量,建立模型三 BP 神经网络模
型预测产品辛烷值(RON)。单隐含层 BP 神经网络预测误差在(-0.36%, 0.55%)之间,双
隐含层 BP 神经网络预测误差在(-0.4%, 0.35%)之间。模型四小波神经网络预测模型的
预测误差在(-0.15%, 0.3%)。对比得知,小波神经网络的预测精度最高,但对比产品辛
烷值预测值与实测值的整体趋势,发现双隐含层 BP 神经网络的预测误差分布更均匀,精
度与小波神经网络预测模型接近。因此选定双隐含层 BP 神经网络作为预测模型。
针对问题四,基于问题三的产品辛烷值(RON)预测模型,同样建立产品硫含量的 BP
神经网络预测模型。建立模型五基于 BP 神经网络预测模型的粒子群寻优算法, 优化主要
变量操作方案。 优化过程中, 除原料辛烷值(RON)的速度为 0 以外, 粒子中的其他主要变
量的速度以 50%的概率取相应的单步调整幅度最大迭代次数 MaxGen取为产
品辛烷值(RON)测量前两个小时内,以 1 次/3min 的调整频次所允许的最大调整次数 40次。
假定合理的产品辛烷值目标区间为(0.5,0.7),最终优化得到全部 325 个样本的最优操作
条件。
针对问题五,利用问题四建立的模型五,根据优化过程中存储的粒子位置矩阵和速度
矩阵,倒推得到操作变量最优解的变化轨迹,再利用问题三的 BP 神经网络预测模型得到
过程中每个操作变量组合的产品辛烷值(RON)和硫含量的变化轨迹,并给出具体的操作变
量轨迹。结果表明: 133 号样本的产品辛烷值(RON)由初始的 88.09 个单位提高到 88.71 个
单位,辛烷值损失降幅达到 52.67%,同时,调整过程中硫含量始终不超过5.00 / g g 。
关键词:互信息理论、非线性相关分析、辛烷值预测、 BP 神经网络、粒子群寻优
链接:https://pan.baidu.com/s/1Uw3eKA7tfw8s4zlTPpdgng
提取码:pj2f