第17届研究生数学建模竞赛C题——面向康复工程的脑电信号分析和判别模型（5）

摘要：

脑电信号的识别和分类是脑机接口技术中非常重要的一环，使用者无需通过复杂训
练就可以获得较高的识别准确率，具有稳定的锁时性和高时间精度特性。本文使用基于
监督学习的随机森林， SVM 算法，半监督学习 S3VM 等算法，以较高的分类准确度，完
成了对 P300 脑电信号的分析和判别。

针对问题一，我们设计了 0.1~20Hz，阻带增益-80dB 的 46 阶带通巴特沃斯 IIR 滤波
器对冗余数据做预处理，以是否出现 P300 脑电信号作为输入标签。考虑到发生 P300 事
件和不发生的样本数不平衡，采用随机排列抽取法生成训练集，并建立了基于随机森林
算法的监督学习分类模型。在 python 环境下搭建算法，预测 5 轮测试数据，采取“投
票” 机制得到不同受试者的 10 个测试结果（共 48 个目标字符），目标字符识别准确率
为 92%，相比 KNN 模型 84%的准确率，识别效果更好。

针对问题二，在问题一数据处理的基础上，从闪烁时刻起记录有效训练数据，并生
成一个维度为的矩阵，同样地对 P300 电位做标签化处理，得到一个 7500 维的
向量。将通道选择问题转换成回归模型，进一步引入“spike and slab”先验分布，建立
贝叶斯稀疏回归模型。使用 python3.8 实现 EP 算法，推导出模型后验分布近似分布，依
据支撑向量后验分布参数选择出最优通道组合，基于通道选择结果，再次采用问题一的
算法和模型，找到了对所有被试者都适用的一组最优通道组合： Fz, F3, F4, C3, Cz, C4,
CP3, CP4, CP5, CP6, P3, P4, P7。

针对问题三，在问题一数据处理和问题二通道选择的基础上，选择 10 个字符的数据
作为训练集（共个样本），其中前 30%作为有标签数据集，后
70%作为无标签数据集，剩下作为验证集（共个样本）。建立半监督
学习的 S3VM 分类模型，并引入正负样本比例因子 r 排除正负样本数目不平衡的问题。
模型通过带标记样本预训练分类器，用拉格朗日启发式方法对无标签样本进行标签预
测，扩充训练集。通过模拟退火的最优化方法进行迭代，并在训练时对初始无标签样本
和有标签样本赋予不同的权重。最终在验证集上的平均准确率达到 75.3%，在测试数据
中得到的结果基本吻合。

针对问题四，我们根据附件 2 所给的精确无噪声的样本标签数据，以及四个分区
Alpha， Beta， Theta， Delta 所占能量强度不同的特点，分别建立随机森林，支持向量机
（SVM） ,以及 LightGBM 三种监督学习算法训练睡眠预测模型。在测试集和训练集的选取
上，采用“交叉验证法”，克服因为训练集测试集不同分割方法引起模型性能不稳定。
测试选取不同比例训练集数据对模型预测精度影响。综合比较 SVM，随机森林和 LGBM
算法预测精度和时间复杂度，得出， LGBM 算法得到的精度为 89%，且算法测试运行时
间较短，其综合运行性能最优。

综上所述，本文建立的脑电信号分析和判别模型地实现了 P300 脑-机接口对目标字符
的识别，最优通道选择，解决了带标签样本较难获得的问题。基于睡眠脑电信号频谱能量
不同特点，建立模型实现了对睡眠状态的预测，有望成为评估睡眠质量、诊断和治疗睡眠
相关疾病的重要辅助工具。

关键词： P300 脑机接口；监督学习；随机森林算法；通道选择；贝叶斯稀疏回归模型；EP； spike and slab；半监督学习 S3VM 算法

链接：https://pan.baidu.com/s/1YvRJs0g1I27hs7Fyjz5RyQ
提取码：ligs

小小程序网

第17届研究生数学建模竞赛C题——面向康复工程的脑电信号分析和判别模型（5）

发表评论取消回复

为您推荐

2015年研究生数模C题——移动通信中的无线信道“指纹”特征建模：原理与实现

2024年大学生数模C题——农作物的种植策略

第20届研究生数学建模竞赛C题——大规模创新类竞赛评审方案研究

第20届研究生数学建模竞赛B题——DFT 类矩阵的整数分解逼近：解析与优化方法

2022年研究生数学建模竞赛优秀论文汇总

第19届研究生数学建模竞赛F题——COVID-19 疫情期间生活物资的科学管理问题

发表评论 取消回复

发表评论取消回复