摘 要:
辛烷值是反映汽油燃烧性能的重要指标, 现有技术在对催化裂化汽油进行脱硫和降烯
烃过程中,普遍降低了汽油辛烷值,造成了辛烷值(RON)的损失。 为在汽油精制过程中
进行优化操作,我们通过对其样本信息进行数据挖掘与模型建立,提供有价值的信息支持。
本文基于汽油精制过程中的样本信息数据,根据操作变量之间的高度非线性和相互强
耦联性,进行数据挖掘与分析。同时, 根据数据宏观层面的规律性、微观层面的差异性,
建立具有针对性的多个数学模型,并使用 R2, MSE, RMSE 等多种参数、模型比对与平稳
性分析, 进行了评估与合理性验证。本文所做的工作可概括为以下几点:
问题一:在判断数据合理性基础上,对样本数据进行预处理。首先,对照变量取值和
Δ值范围,查找异常数据;其次,根据最大最小的限幅,剔除限幅外数据;然后,根据拉
依达准则,去除异常值,共清洗剔除了附件三中的 726 条数据。最后, 进行样本值确定,
分别将 285 号和 313 样本操作变量的平均值与同一行进行比较,285 号的契合度达到 100%,
313 号存在些许差,多数数值的契合度达到 90%以上。
问题二:根据数据特性,建立了 mRMR-IFS-SVR 模型。首先使用最大相关—最小冗余特征选择方法(mRMR)求解特征与目标损失值的相关性列表,获取 30 个主要变量的候选
列表;其次,考虑到变量之间的高度非线性和相互强耦联,我们联用增量特征选择方法(IFS),
建立了高斯核函数支持量回归模型(rbf-SVR),以评估参数筛选出了 24 个主要变量。同时,
通过相关系数、互信息和最大信息数、随机森林、递归特征消除等方法验证主变量筛选的
合理性。
问题三:本题主要通过数据挖掘技术建立辛烷值损失预测模型,即通过样本数据,求
解最佳回归模型。由于数据本身的变量之间具有高度非线性和相互强耦联的关系,因此,
本题选取相应的回归模型进行求解。我们主要联用第二问的 rbf-SVR 模型,与决策树回归、
随机森林回归、梯度上升回归树进行比较评估参数选取最佳预测模型。最终确定了拟合优
度为 93.75%的决策树回归模型。
问题四:基于合作博弈论,对筛选样本数据进行分析, 并建立多目标优化模型。 沿用
决策树回归建立硫含量与 24 个主变量的预测模型, 我们重点建立了“合作博弈——PareTo
强度进化算法”:输入样本数据的操作变量,约束其上下限,根据“合作博弈”方法、“PareTo
强度进化算法”,进行多次实验的多次迭代求近似最优解;获取多次迭代的最优解对应的
操作变量值取平均增降幅度,使用分布密度函数求得均值以及置信区间,提供整体操作变
量的优化方案。 同时,通过验证样本契合度、模型迭代的稳定性说明其合理性。
问题五: 本题沿用了第四问中第 133 号样本的多次迭代最优解平均值作为增降服务的
参考,使用贪心算法对主要变量进行逐步调整, 总调整步长为 259, 展现了汽油辛烷值和
硫含量的变化轨迹。 第 234 步时达到最优,辛烷值最高为 88.7,硫含量为 3.4μg/g。当调
整步长为 228 时,硫含量最低为 3.2μg/g。
关键词: 辛烷值;汽油精制; mRMR-IFS-SVR 模型; 决策树回归; 合作博弈论; PareTo强度进化 算法
链接:https://pan.baidu.com/s/1dA4b4b0VDVg3AEPmeGXtPA
提取码:4d67