第17届研究生数学建模竞赛B题——降低汽油精制过程中的辛烷值损失模型(3)

摘 要:

汽油辛烷值含量对汽油的燃烧性能具有重要的影响。在保证硫含量较低的情况下,应尽量降低辛烷值在汽油精炼过程中的损失。本文采用数据挖掘技术,研究了辛烷值优化建模等问题,具有一定的现实意义。

针对问题一, 首先参考附件一中的预处理结果,按照附件二中的数据处理要求对 285313 号样本的原始数据进行遍历,检验其是否存在如数据值缺失、超出操作变量范围和不满足拉依达准则等异常值并剔除。之后判断每位点的数据缺失值比率是否超出设定的阈值,根据判断结果采取删除位点或对空缺值进行拉格朗日插值操作。最后对预处理过的数据组取平均值, 获得 285 313 号样本的数据处理结果。 两样本共检测出异常数据 477 个,按照步骤进行预处理之后的结果与附件一已给数据对比,发现仅存在微小差异,原因可能是选择的处理标准略有不同。

针对问题二, 为从 367 个变量中选取建模的主要变量,需要进行降维处理。首先对附件一的预处理数据进行分析,剔除掉存在大量异常数据和物理意义不合理的位点。然后分析了各变量之间的相关性,得出各变量之间具有较强的相关性。为较好地筛选主要变量,采用机器学习算法中适用于处理非线性关系的随机森林对样本数据进行分析,得出了影响产品辛烷值的各自变量的重要性排序。初步选取了排序前 60 的自变量。考虑到某些自变量之间也具有高度的相关性,为保证选取了变量具有独立性,采用距离相关系数对 60 个变量进行分析,逐步剔除自变量之间相关性较高的变量。最终选取 27 个主要变量。再次对选取的 27 变量计算两两相关性,结果表明,选取的变量之间关系较弱,具有很好的独立性。同时,选取的 27 个变量在物理意义上具有很好的可解释性,说明 27 个主要变量的选取是合理的。

针对问题三, 为建立辛烷值损失预测模型,需要准确地预测产品中的辛烷值。由于上述选取的主要变量和产品辛烷值之间具有较强的非线性关系,一般的线性模型并不完全适用。考虑到神经网络具有很强的非线性映射能力,且精度很高,本文建立了三层 BP 神经网络对产品辛烷值进行预测。输入层具有 27 个神经元,输出层具有 1 个神经元。选取 80%的样本作为训练集, 20%的样本作为测试集对网络进行训练。经过反复实验得出隐含层神经元的最佳个数为 50。结果显示,建立的预测模型的均方误差(MSE)为 0.0146,误差百分比最大仅为 0.25%,具有较高的精度,能够精确地预测产品中辛烷值含量。由于原料中辛烷值含量已知,于是可以精确地预测辛烷值损失。

针对问题四, 为分析辛烷值优化后损失降幅大于 30%的样本,并得出主要变量的操作条件,建立了优化模型。以辛烷值损失最小为目标函数,选取 23 个可变的操作变量为决策变量.由于操作变量具有取值范围,因此决策变量存在约束。同时考虑到实际的辛烷值不能超过原料中的辛烷值,硫含量的范围在 05 微克/克,建立了综合的约束条件。针对这一目标优化的问题,考虑到其搜索空间大,全局最优解寻找难度大的特点,采用了粒子群算法对这一优化问题进行求解。通过 Python 编写程序,求解得出:在 325 个样本中,有
103 个样本经过优化后其辛烷值损失降幅大于 30%,硫含量均低于 5 微克/克,同时获得了23 个操作变量的操作条件,说明建立的模型是合理有效的。

针对问题五, 首先根据问题四中得出的优化模型计算 133 号样本对应的最优操作条件。以各变量达到最优操作条件为目标,使各个操作变量自初始值按照各自调整步长Δ向最优条件逐步前进。在每一步前进的状态点,使用建立的辛烷值和硫含量的预测模型预测此时的辛烷值和硫的含量,并记录。根据记录的辛烷值和硫含量的数据即可绘制随调整次数变化的辛烷值和硫含量的轨迹。绘制的轨迹表明, 133 号样本的产品辛烷值的优化结果为88.48,辛烷值损失降低幅度达到 30.54%,产品硫含量最终低于 5 微克/克,效果较好。此外,分析了产品中辛烷值含量和硫含量的变化趋势,其中产品辛烷值的轨迹逐渐提高符合预期,硫含量的变化趋势呈现出一定的随机性,对此现象作出了合理性的解释。

关键词: 汽油辛烷值,相关性分析,随机森林, BP 神经网络,粒子群算法

链接:https://pan.baidu.com/s/1mfVZW1_nHJUKXnv3SeLEpg
提取码:htb3

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注