第17届研究生数学建模竞赛B题——降低汽油精制过程中的辛烷值损失模型(6)

摘 要:

辛烷值(RON)是反映汽油燃烧性能的最重要指标。 然而, 现有技术在对催化裂化汽
油进行脱硫和降烯烃过程中,普遍降低了汽油辛烷值,造成了经济损失和环境压力。 随着
信息技术的发展,数据挖掘技术已逐步应用于化工过程,亟需探索数据挖掘技术下的辛烷
值模型和优化方法。 围绕如何建立辛烷值模型和优化方法这一问题,本文串联起每一子问
题, 提出了考虑工艺实际、创新性的解决方案并验证可行。 首先, 对附件
3 285 313
号两个样本按照整定方法进行预处理, 并将处理后的数据放入附件 1 供后续研究。然后,
设计了两阶段整定算法对附件
1 325 个样本 367 个变量预处理,提出 4 种代表性的特征
选择和降维方法并求解,进而提出综合筛选模型以融合各方法的优点。进一步改进综合筛
选模型,将非操作变量和操作变量分开单独建立与辛烷值之间的关系模型,并求解自变量
之间的相关度,满足代表性和独立性的需求,最终得到
30 个主要影响变量。在预处理和求
解主要影响变量后,建立改进的长短期记忆网络(
LSTM) 预测模型预测产品辛烷值,从而
预测辛烷值损失。利用遗传(
GA) 算法改进 LSTM 的参数选择,并对比了其他 3 种典型
的预测方法,确定了该模型在辛烷值损失预测方面的优势。 建立脱硫率的预测模型标准含
硫量, 采用
GA PSO 两种算法对 325 个样本进行优化, 得到操作条件。 最终,依据前一
步的优化模型和操作变量调整幅度限制,针对
133 号样本采用均匀步长调整策略以保证生
产的稳定性。结合辛烷值、硫含量预测模型以及
t 分布随机邻域嵌入(t-SNE)的非线性降
维方法,绘制了二维和三维的辛烷值和硫含量的变化轨迹实现了模型的可视化展示。

在问题一中,先只针对附件 3 285 313 号两个样本按照所给的 5 种方法进行整定,
求解发现只有产品辛烷值和辛烷值损失与附件
1 给定的数据略有差别,考虑到化工采样方
法可能不同,这一微小差别能够满足工程需要,因此采用附件
1 数据进行后续研究。

在问题二中, 在问题一的基础上首先对附件 1 的样本数据进行整定,设计了两阶段整
定算法,迭代
7 次后将 325 个样本、 367 个变量筛选为 252 个样本、 230 个变量。然后,提
出综合筛选模型,将特征选择和降维方法中代表性的相关系数矩阵法、距离相关系数法、
递归特征消除(
RFE) 、主成分分析(PCA)这 4 种方法分别求解产品辛烷值与其余 229
变量的相关性, 并综合
4 种方法的优点。进一步的,通过将非操作变量和操作变量分别单
独建立与产品辛烷值的相关性模型,得到改进的综合筛选模型,增强筛选变量的代表性;
寻找
229 个自变量之间的相关度,剔除相关度高的变量,增强筛选变量的独立性。 最终,
Python 的环境下编写程序, 得到硫含量、原料辛烷值、饱和烃、烯烃、 S.1K101B
排气温度等共 30 个主要影响变量,其中 5 个非操作变量, 25 个操作变量。

在问题三中, 将问题二得到的 30 个主要影响变量作为批处理, 建立 LSTM 预测模型,
选取训练集:测试集
=80%20%,分析了输入输出维度和结构, 并建立了 LSTM 预测模型
的评价指标。然后,采用
GA 算法改进 LSTM 的参数选择,进一步增强预测精度。同时,
为验证预测算法的有效性,对
RFSVRXGBoost 这三种代表性的预测方法在 Python
境下实现,与
LSTM 预测结果进行对比。最终, GA 改进的 LSTM 模型预测精度能够满足
工程要求,而且较其他三种方法其
RMSEMAPE 指标均具有优势,结果如下表:

LSTM XGBoost SVR RF
RMSE 0.19269 0.21558 0.28495 0.26148
MAPE 0.49425 0.52689 0.59863 0.56217

在问题四中, 由于优化过程需要约束含硫量, 因此也需要按照相似的方法建立硫含量
的预测模型。 运用转化的思想, 通过建立预测精度更高工程上更实用的脱硫率预测模型来
表征含硫量, 每一样本的脱硫率预测精度在
0.21%-0.67%之间, 满足工程要求。 建立 GA
法下的适应度函数, 并将含硫量的约束推导为障碍函数置于目标函数。 综合考虑算法求解
性能与工程实际意义, 改善
GA 算法的初始种群设计, 使得 GA 算法不但具有良好的搜索
能力,而且具有响应速度和梯度优势。 为保证优化过程符合工程实时工况的短时特性, 设
置迭代上限为
4 时, 325 个样本有 252 个样本辛烷值损失降幅超过 30%,而有 73 个样本未
超过
30%,达标率为 77.54%。这是由于部分样本迭代次数达到程序设定的上限,若将迭代
次数改为
5 次,则达标率为 90.64%,但时间会更长, 因此会存在达标率和迭代时间的权重
问题, 实际工程可根据情况进行权重赋值。 求解得到
325 个样本的操作条件, 并对 66 号样
本单独举例分析了其操作条件以及
GA 的优化过程。 同时, 通过 66 号样本展示 PSO GA
算法在辛烷值优化的优劣, GA 下的辛烷值损失降幅大于 PSO 下的辛烷值损失降幅,这是
由于
PSO 容易陷入局部最优,造成较快收敛, 而 GA 的速度较慢。

在问题五中, 在问题四得出的操作变量优化结果的基础上,对 133 号样本等步长均匀
地调整操作变量
1519 次, 绘制了辛烷值和硫含量随操作变量调整次数的变化曲线,调整完
步使得辛烷值损失降幅达
50%,硫含量下降,进一步验证了前述模型的正确性。随后采用
t-SNE 非线性降维方法,将 25 维操作变量降至二维,绘制二维、三维图以表征辛烷值和硫
含量的变化轨迹并指出变化方向。

本文的创新点和亮点有:第一, 考虑化学工艺流程,结合实际,保证理论实际相结合;
第二, 建立了问题之间的联系,使得整个问题具备整体性;第三, 在筛选主要变量的过程
中,提出综合筛选模型并进一步改进, 综合了
4 种特征选择和降维方法的优点,使得筛选
效果更佳;第四, 考虑筛选变量的代表性和独立性, 将非操作变和操作变量分别单独与辛
烷值建立相关性模型,并寻找自变量间的相关性; 第五, 对比了其他
3 种预测方法,凸显
LSTM 预测模型在辛烷值预测时的优势;第六,通过转化为脱硫率表征较为准确的硫含量,
并建立了以辛烷值的
GA 优化模型; 第七, 对比 PSO GA 两种算法在辛烷值优化中的优
势; 第八, 采用
tSNE 降维方法,相较于 PCA 等线性降维方法能够更好地区分和判断辛
烷值和硫含量的变化轨迹和变化方向。

关键词: 辛烷值, 整定,综合筛选模型, 改进 LSTM 预测模型, GA 优化算法

链接:https://pan.baidu.com/s/1Irct78XwnDMhY-PSxvKOgw
提取码:etv0

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注