第17届研究生数学建模竞赛B题——降低汽油精制过程中的辛烷值损失模型(7)

摘 要:

汽油的辛烷值(RON) 是衡量汽油在气缸内抗爆震燃烧能力的数字指标, 值高表示其
抗爆性能好。 某企业汽油产品辛烷值损失有较大优化空间, 急需用数据挖掘技术(统计、
机器学习等方法) 解决辛烷值损失问题。

针对问题一, 要按“样本确定方法” 对 285 号和 313 号样本进行预处理。 我们对于某
个变量数值全部缺失进行了删除, 对于某个变量数值部分缺失的用均值代替。 根据拉依达
准则剔除异常值, 其中利用了贝塞尔公式得到标准误差
delta.样本 285 中没有发现异常值,
样本
313 中发现 53 个异常值, 进行了剔除。 最后取六点到八点的操作数据的平均值作为
对应辛烷值八点的操作变量数据。

针对问题二, 要从 367 个变量中寻找影响产品辛烷值的三十个以下主要变量。 首先我
们进行了散点图分析, 观察每个变量和产品辛烷值之间是否存在线性关系, 对于能观察出
线性关系的变量均予保留。 对于不能观察出线性关系以及不能通过非线性变化转化成线性
关系的变量进行筛出。 接着进行斯皮尔曼相关分析, 对在
99%的置信区间上显著的变量进
行相关系数的排名, 剔除了相关系数小于
0.3 的变量, 得到了 53 个变量。 然后对这些变量
运用
SPSS 软件进行系统聚类, 得到聚类谱系图, 从 23 类每类里选出相关系数较高的变量。
最后广泛查阅相关文献, 综合确定了
29 个主要变量。

针对问题三, 根据确定的 29 个主要变量, 要通过数据挖掘建立辛烷值损失预测模型,
并进行验证。 由于炼油工艺过程的复杂性和设备的多样性, 它们的操作变量之间具有高度
非线性的关系。 并且传统的数据关联模型中变量比较少, 急需优化。 我们分别建立了
BP
神经网络模型和多元非线性回归模型进行辛烷值损失预测。
我们设计了
3 个三层全连接的神经网络模型, 将 20 个重要变量全部输入, 将 9 个非
重要变量分批次输入到模型中。 模型的输入层为
23 个神经元, 模型预测的结果由三个模
型预测值取均值得到。 模型一中输入的三个非重要变量得到的均方误差最低, 接近
0.6
模型二与模型三得到的均方误差接近
3, 在实验的接受范围内。 取均值后我们将 9 个非重
要变量共同计入考虑, 得到的预测值经过均值处理后更加平稳、 准确。
建立多元非线性回归模型过程中, 我们将
325 个样本分成拟合样本和预测样本。 借助
SPSS 软件不断提高模型的拟合优度, 得到了辛烷值损失预测函数。 接着将 50 个预测样本
代入函数, 与实际辛烷值损失比较, 辛烷值损失预测值与实际值之间的差值在
0.3 以内,
精确度较高。

针对问题四, 要求保证产品硫含量不大于 5μg/g 的前提下, 得到样本对应的主要变量
优化的操作条件, 使辛烷值损失降幅大于
30%.由于问题有约束条件和目标, 以及由问题三
得到的多元非线性回归函数, 我们建立了非线性规划模型。 目标函数是最小化辛烷损失值,
决策变量是
18 个主要操作变量, 约束条件是硫含量小于等于 5μg/g 和每个变量的可操作
范围, 还要满足损失降幅 30%以上。 我们针对一些样本给出了具体的操作优化方案。

针对问题五, 要求用图形展示 133 号样本主要操作变量优化调整过程中对应的汽油辛
烷值和硫含量的变化轨迹。 结论有反应压力、 氢油比、 催化汽油进装置总流量、 反应器质
量空速、 氮气进装置流量和产品辛烷值的量化关系, 以及主要变量和产品硫含量的量化关
系。

关键词: 汽油辛烷值损失、 数据挖掘、 Spearman 相关系数、 系统聚类、 BP 神经网络模型、 relu 函数、 多元非线性回归模型、 非线性规划模型

链接:https://pan.baidu.com/s/1Xi9yMOzMANFFHJMY8cAn8w
提取码:ke3w

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注