专访上海大学方昱春教授：数据驱动的手语识别研究，如何破解数据之困？｜GAIR live

AIGC动态1年前 (2024)发布 aitechtalk

3,191 0 0

模型信息

【模型公司】 Azure
【模型名称】 gpt-4-32k
【摘要评分】 ★★★★★

文章摘要

【关键词】 计算机视觉、手语识别、深度学习、数据采集、人体姿态建模

本文主要讲述了上海大学的方昱春教授如何将计算机视觉技术与手语研究相融合，开辟出一片新的研究天地。

方教授的研究重点在于利用计算机视觉技术（CV）探索手语识别，特别是通过深度学习方法来求解这一复杂而神奇的自然语言交流形式。目前她和团队已经在多模数据采集、孤立词识别、连续手语识别以及人体姿态建模等四个方向上开展了研究。

方教授的学术研究始于人脸识别，随着时间的推移，她的研究兴趣逐渐扩展到手语识别这一领域。2003年，她在中科院自动化所获得博士学位，之后前往法国国立信息与自动化研究院做博士后，从事图像检索研究。虽然手语研究并非她最初的研究重点，但在2005年加入上海大学后，方教授逐渐将研究重心转向了手语领域。特别是在2017年，她协助本校手语语言学专家倪兰教授筹建面向人工智能研究的手语数据库，并在2018年获得上海市科委项目支持，正式开展手语识别研究。

在方教授看来，手语研究不仅是技术探索的过程，更是深入理解人类认知智能机制的重要途径。她指出：“手语作为一种自然语言，尽管其发展历史相对较短，但它所蕴含的关于语言发展和认知机制的信息是极其珍贵的。” 如今，方教授的研究不仅关注于手语的理论研究，更致力于解决手语在实际场景中的应用问题，为聋人群体在应急、医疗和购物等实际场景中提供数字化技术支持。方教授和团队正在开发的应用程序和小程序，正是这一目标的具体实践。

此外，她也指出，随着大型语言模型等前沿科技的发展，手语识别研究将面临新的机遇和挑战。她的团队正在积极探索结合计算机视觉和自然语言处理的方法，以期在手语研究领域取得更多突破。