第17届研究生数学建模竞赛C题——面向康复工程的脑电信号分析和判别模型(1)

摘 要:

大脑是人体中高级神经活动的中枢,拥有着数以亿计的神经元,并通过相互连接来传
递和处理人体信息,借助于技术手段对信号进行处理和分析有助于生理健康的判断和神经
性疾病的监测,比如通过机器学习和数据挖掘,对大量数据进行训练学习从而找出规律进
行分类识别,对数据进行反复的训练和测试有利于进一步提高识别精准率,为临床治疗提
供重要的辅助作用。
借助于数据预处理,支持向量机、随机森林、卷积神经网络等机器学习方法就目标识
别、通道选择、样本训练和测试、睡眠分期预测问题进行了数学建模和编程尝试,以求更
好的结合实际解决问题。

问题一先将目标识别问题转化为判别每一周期是否出现 P300 信号的问题,将原始数
据滤波处理成训练数据 X 和测试数据 C,并将训练数据 X 进行随机排列、倍增等处理,再
将训练数据 X 进一步区分为训练集 A 和测试集 B。接着比较三种机器学习算法(支持向量
机、随机森林、卷积神经网络)在训练集 A 上训练并在测试集 B 上测试效果,选择用卷积
神经网络对测试数据 C 进行预测。同时发现对 S1 受试者的目标识别准确率始终低于受试
者 S2-S5, 在不考虑受试者 S1 识别效果的前提下,统计 S2 到 S5 的 10 个待识别目标预测
情况,最终 10 个待识别目标的预测结果为 MF52ITKXA0。

问题二主要使用了卷积神经网络算法进行单个被试者通道选择设计,利用卷积核权重
来衡量 20 个通道的重要程度, 针对单个个体进行特定分析, 将权重值较高的通道筛选出
来,结果发现通道选择情况因人而异,每个受试者的较优通道组合有一定的差异,同时又
有一定的相似性,在训练过程中我们发现 S4 和 S5 受试者脑电信号特征较为明显, 受噪声
干扰小,所以将 S4 和 S5 较优通道全部纳入选择, 另外如果一个通道被 3 个以上的受试者
选中,那么该通道也将纳入选择,由此选出一组最优通道组合(一共 15 个通道):
1,2,3,4,5,6, 7,8,9,10,11,13,14,16,19。为了进一步判断通道选择质量好坏,我们只考
虑该组最优通道,再次对 S1-S5 受试者训练数据集合中的测试样本进行目标识别分析,发
现相较于原始 20 个通道全部考虑的情况, 通道选择后的识别准确率有一定程度的提高,
从而验证了该最优通道组合比较适合所有受试者。

问题三主要采用了标签传播算法和自适应半监督学习算法进行监督学习和半监督学
习的比较,标签传播算法的训练结果不收敛,故舍弃该方法。自适应半监督学习算法训练
结果显示,采用自适应半监督学习算法的预测准确率有一定提升,预测稳定性有大幅提升。
通过对 S1 到 S5 的前五个字母预测准确程度的辨别,我们选择了对前五个字母预测较为准
确的预测信息进行对后五个字母的预测,结果为 TKXA0,且预测的一致性比较高。

问题四主要使用了神经网络和支持向量机两种方法对睡眠分期进行预测,基于训练样
本比例和预测准确率考虑,将训练样本数要求较少预测准确率较高的支持向量机方法用来

设计预测模型,随机的从每个睡眠分期中选择等量样本进行训练,通过观察预测精准率随
样本量比例的变化情况,发现训练集使用比例在 0.1 到 0.2 和 0.8 到 0.9 两区间内上升趋
势明显,而比例在 0.2-0.8 区间范围内趋势平缓(测试集准确率随训练样本增加不明显),
由此我们认为使用训练集比例为 0.2 时,可保证在使用较少训练集数据的前提下获得良好
的分类效果, 即最终用支持向量机方法以占总体样本 0.2 比例的训练样本实现了 71%左右
的预测准确率。

关键字: 滤波处理 卷积神经网络 主成分分析 支持向量机 半监督学习

链接:https://pan.baidu.com/s/1QjMjwjFOoeVB5BViOH3APw
提取码:lezn

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注