摘 要:
脑电信号的识别和分类是脑机接口技术中非常重要的一环, 使用者无需通过复杂训
练就可以获得较高的识别准确率,具有稳定的锁时性和高时间精度特性。 本文使用基于
监督学习的随机森林, SVM 算法,半监督学习 S3VM 等算法,以较高的分类准确度,完
成了对 P300 脑电信号的分析和判别。
针对问题一,我们设计了 0.1~20Hz, 阻带增益-80dB 的 46 阶带通巴特沃斯 IIR 滤波
器对冗余数据做预处理,以是否出现 P300 脑电信号作为输入标签。考虑到发生 P300 事
件和不发生的样本数不平衡,采用随机排列抽取法生成训练集, 并建立了基于随机森林
算法的监督学习分类模型。 在 python 环境下搭建算法,预测 5 轮测试数据,采取“投
票” 机制得到不同受试者的 10 个测试结果(共 48 个目标字符),目标字符识别准确率
为 92%,相比 KNN 模型 84%的准确率, 识别效果更好。
针对问题二,在问题一数据处理的基础上,从闪烁时刻起记录有效训练数据,并生
成一个维度为 的矩阵, 同样地对 P300 电位做标签化处理,得到一个 7500 维的
向量。 将通道选择问题转换成回归模型,进一步引入“spike and slab”先验分布,建立
贝叶斯稀疏回归模型。 使用 python3.8 实现 EP 算法, 推导出模型后验分布近似分布,依
据支撑向量后验分布参数选择出最优通道组合, 基于通道选择结果,再次采用问题一的
算法和模型,找到了对所有被试者都适用的一组最优通道组合: Fz, F3, F4, C3, Cz, C4,
CP3, CP4, CP5, CP6, P3, P4, P7。
针对问题三,在问题一数据处理和问题二通道选择的基础上,选择 10 个字符的数据
作为训练集(共 个样本),其中前 30%作为有标签数据集,后
70%作为无标签数据集,剩下作为验证集(共 个样本)。建立半监督
学习的 S3VM 分类模型,并引入正负样本比例因子 r 排除正负样本数目不平衡的问题。
模型通过带标记样本预训练分类器,用拉格朗日启发式方法对无标签样本进行标签预
测,扩充训练集。通过模拟退火的最优化方法进行迭代, 并在训练时对初始无标签样本
和有标签样本赋予不同的权重。最终在验证集上的平均准确率达到 75.3%,在测试数据
中得到的结果基本吻合。
针对问题四,我们根据附件 2 所给的精确无噪声的样本标签数据, 以及四个分区
Alpha, Beta, Theta, Delta 所占能量强度不同的特点,分别建立随机森林,支持向量机
(SVM) ,以及 LightGBM 三种监督学习算法训练睡眠预测模型。在测试集和训练集的选取
上,采用“交叉验证法”,克服因为训练集测试集不同分割方法引起模型性能不稳定。
测试选取不同比例训练集数据对模型预测精度影响。综合比较 SVM,随机森林和 LGBM
算法预测精度和时间复杂度,得出, LGBM 算法得到的精度为 89%,且算法测试运行时
间较短,其综合运行性能最优。
综上所述,本文建立的脑电信号分析和判别模型地实现了 P300 脑-机接口对目标字符
的识别,最优通道选择,解决了带标签样本较难获得的问题。基于睡眠脑电信号频谱能量
不同特点,建立模型实现了对睡眠状态的预测,有望成为评估睡眠质量、诊断和治疗睡眠
相关疾病的重要辅助工具。
关键词: P300 脑机接口;监督学习;随机森林算法;通道选择; 贝叶斯稀疏回归模型;EP; spike and slab; 半监督学习 S3VM 算法
链接:https://pan.baidu.com/s/1YvRJs0g1I27hs7Fyjz5RyQ
提取码:ligs