第17届研究生数学建模竞赛B题——降低汽油精制过程中的辛烷值损失模型(9)

摘 要:

现有技术在对汽油进行催化裂化过程中,普遍降低了汽油辛烷值,故对汽油精制过程
进行有效建模, 具有重要的研究价值。 本文从理想到实际,逐步按需建立了降低汽油精制
过程中的辛烷值损失模型,对题目所给出的问题进行快速有效求解。

针对问题一, 对 285 号和 313 号数据样本的原始数据进行处理。首先,结合汽油精制
工业背景对原始数据和样本数据进行分析,提出四种适用于本文的数据预处理方法: 针对
采集时间异常的样本进行剔除处理; 针对超出取值范围的数据进行剔除; 针对异常非操作
变量数据采用依拉达准则进行剔除;针对缺失数据采用拉格朗日插值和均值插补进行填
充。最后,对预处理后的附件三中
285 号和 313 号原始数据样本进行计算,并将处理后的
结果分别加入到附件一中相应位置。

针对问题二, 筛选出辛烷值损失模型中的主要建模变量。首先,根据变量类型不同对
操作变量和非操作变量进行差异化筛选建模:对于操作变量,建立基于随机森林的特征重
要度筛选模型;对于非操作变量,建立基于相关性分析的非操作变量特征筛选模型。然后,
对模型进行求解,从所有变量中筛选出
26 个建模主要变量, 其中包括 16 个主要操作变量
10 个主要非操作变量。最后,采用信息熵理论对主要变量的代表性进行验证,采用相
关性分析法对主要变量的独立性进行验证。

针对问题三, 建立辛烷值(RON)损失预测模型。首先,分析得出辛烷值损失由“原
料辛烷值”与“产品辛烷值”经二次计算得到,直接建模预测辛烷值损失则效果不佳,考
虑进行预测目标转换, 先建立产品辛烷值的预测模型,再根据结果得到相应的辛烷值损失
值。其次,分别建立基于多元线性回归、 随机森林、 梯度提升回归的产品辛烷值预测模型,
并对三种模型的预测效果进行分析。最后,对模型进行敏感性分析, 探究代表变量与辛烷
值损失之间的内在联系。

针对问题四,对主要变量操作方案进行优化。首先,以最大化辛烷值损失降幅为目标
函数,以
16 个主要操作变量为决策变量, 以产品硫含量和决策变量取值范围为约束,建
立主要变量操作方案优化的线性规划模型。其次, 采用自适应和声搜索算法对模型进行求
解,并对算法关键内容进行针对性设计,求解得到辛烷值损失降幅大于
30%的样本占比为
71.7%,并对这部分样本的主要操作方案进行优化和分析。最后,进行算法对比分析, 证
明了自适应和声搜索算法的有效性和优越性。

针对问题五, 对模型进行可视化展示。考虑到问题特性和汽油精制过程的复杂性, 拟
从三个层面进行本文模型的可视化展示:一、产品性质层;二、操作方案层;三、内在关
联层。 并以
133 号样本为展示对象,显示出相应的可视化图像。

最后,对问题的模型与算法中的优点和不足进行了总结。

关键词: 数据挖掘;随机森林;相关分析; GBR 模型; 线性规划; 和声搜索算法;

链接:https://pan.baidu.com/s/1dnwr5h8-mqTfQGN5Hw_TuA
提取码:gqw4

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注