天桥脑科学研究院资助的首个中文脑电图数据集研究项目登上《自然》子刊|钛媒体AGI
文章摘要
【关 键 词】 脑电图数据、中文语言、神经科学、数据处理、AI应用
近日,南方科技大学刘泉影教授与澳门大学伍海燕教授合作,在《Nature》子刊《Scientific Data》上发表了首个针对中文语言的脑电图数据集“ChineseEEG”。这一数据集的创建,对于神经科学、语言学及相关领域具有重要意义,并有望在脑机接口、语义解码等领域得到广泛应用。通过记录参与者默读中文文本时的脑电图数据,研究团队填补了非英语刺激下的脑电图数据集空白。
研究指出,大脑处理语言的复杂机制在理解语言信息时启动一系列神经活动,而不同语言的结构差异导致大脑处理方式的差异。为此,研究团队采用《小王子》和《狼王梦》两部中文小说作为实验材料,每位参与者接受长达12小时的中文语言刺激,以捕捉大脑处理中文的神经活动。
ChineseEEG数据集的优势在于提供多种预处理后的脑电图传感器级数据以及由BERT-base-chinese模型生成的中文文本嵌入。这为研究自然语言处理模型中的文本表示与大脑神经活动之间的关系提供了新视角。数据集的高密度脑电图数据和采样率使得研究人员能精确追踪大脑阅读中文时的微妙变化。
此外,数据集的脑电图数据和文本嵌入经过处理,便于不具备相关专业背景的人使用。这些数据可应用于时频分析、脑电图源重建、文本嵌入和数据分析等领域。天桥脑科学研究院推出的MindD数据支持计划为这一研究提供了资助,旨在推动人类大脑及相关全身和行为数据的采集、分析和训练。
展望未来,随着技术成熟和数据集丰富,预计将涌现更多创新研究成果,深化人类对大脑如何处理语言及其他复杂任务的理解。MindD计划将继续助力相关研究领域突破数据瓶颈,为“AI+脑科学”的发展奠定基础,并吸引国际合作和跨学科研究,加速AI技术在医疗和健康领域的实际应用。
原文和模型
【原文链接】 阅读原文 [ 2019字 | 9分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 glm-4
【摘要评分】 ★★★★★