第17届研究生数学建模竞赛C题——面向康复工程的脑电信号分析和判别模型(2)

摘 要:

对脑电信号的准确有效分析,有助于把握大脑的活动状态,是实现脑机接口
技术和评估睡眠质量的重要前提。本文分别考虑了目标字符识别问题、最优组合
通道的选取问题,使用部分无标签数据进行半监督学习问题、数据集选取方式和
分配比例问题、睡眠分期问题,并分别建立模型进行求解。

针对问题一,考虑原始诱发脑电包含干扰信号,利用经验模态分解方法得
8 IMF 分量,分析不同频率下的信号特征。采用四阶低通 Butterworth 滤波
器和快速傅里叶变换进行滤波和去噪。将原始训练集按
5:1 划分为训练集和测试
集,利用重采样方法实现正负样本平衡,通过识别目标字符所在的行和列,将
多分类问题转化为二分类问题。建立了基于
SVMDNNLSTM 1D-CNN
目标字符识别模型,验证集上的识别准确率分别为
68.17%71.12%73.44%
77.87%。仅通过 2 轮实验,就可实现测试集字符的准确预测, char13char22
识别结果依次为
MF52ITKXA0(被试者 S2 S3 由于原始
数据的问题仅能识别
char13char21,结果与其余三个被试者相同)。

针对问题二,考虑各个通道重要程度不同,建立了带注意力机制的 1D-CNN
通道筛选模型,得到了每个被试者 20 个通道的注意力权重。分别选取权重最大
15 个通道作为每个被试者的最优组合通道,被试者 S1 {FzF3F4Cz
C4T7CP3CP4CP5CP6PzP3P4O1O2}S2 {FzF3Cz
C3T7CP3CP5CP6P3P4P7P8OzO1O2}S3 {FzF4C3
C4T8CP3CP4CP6PzP3P4P7P8OzO1}S4 {FzF3F4
CzC4T7T8CP3PzP3P4P7OzO1O2 }S5 {FzF3Cz
C3T7T8CP3CP5PzP3P4P7P8OzO1} 将其取交集得到适用
于所有被试者的最优组合通道
{FzCP3P3P4O1},且每个被试者基于 15
通道和 5 通道的测试集识别结果均为 MF52ITKXA0。五名被
试者基于
5 通道的 1D-CNN 验证集平均识别准确率为 75.20%,基于原有 20 通道
77.87%,引入注意力机制后小幅提升为 77.93%,基于 15 个最优组合通道时
进一步提升为
78.06%

针对问题三,考虑部分数据无标签,利用问题一中的 1D-CNN 预测网络、问
题二的最优通道组合和现有标签数据预训练得到了初始分类模型。按是否使用
先验信息,设计了两种伪标签添加方式。无先验信息时,利用初始分类模型,对
无标签数据添加伪标签,选出
softmax 输出概率大于 0.8 的数据,将其添加到标
签数据中,并更新初始分类模型;使用先验信息时,考虑到每轮测试中每行和每
列都会各出现一次正样本,其余为负样本,选取所有行中输出概率最高的行作为
行预测结果,列预测同理,并将其作为无标签数据的伪标签。实验结果表明,上
述过程重复
10 次后,所有无标签数据都会被添加到标签数据中,也即得到了稳
定的半监督学习分类模型。无先验和有先验方式最终对
char13char22 的识别结
果均为
MF52ITKXA0,在验证集上的分类准确率分别从初
始的
63% 提升至 67.23% 71.48%,接近有监督训练的分类准确率 75.2%,验证
了半监督学习模型的有效性。

针对问题四,考虑原始睡眠脑电数据仅包含四个特征,从能量角度出发构造
9 个新特征,扩充了原有数据集,并按训练集和测试集 4:1 的比例随机划分了
100 次, SVM、随机森林和 CatBoost 100 个测试集上睡眠分期的平均分类正
确率分别为
65%94.3%95.06%。改变训练集占总样本的比例分别为 0.80.7
0.60.5 0.4,得到 CatBoost 100 个测试集上睡眠分期的平均分类正确率分
别为
95.06%91.22%88.42%85.73% 82.06%,验证了所建立的模型可以在
较少训练样本情况下实现较高的分类正确率。

关键字: 脑电信号 傅里叶变换 1D-CNN LSTM CatBoost

链接:https://pan.baidu.com/s/1S7S0jx6ylzIvd4aYwPlEug
提取码:qssp

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注