从实验室到现实,AI+手语识别,路向何方?|GAIR live

AIGC动态9个月前发布 aitechtalk
549 0 0
从实验室到现实,AI+手语识别,路向何方?|GAIR live

 

文章摘要


【关 键 词】 人工智能听障人士手语识别数据算法

田英利教授,作为计算机视觉领域的权威专家,这十年来专注于将手语识别技术应用于改善听障人群的沟通。

倪兰教授,拥有丰富的语言学背景,二十年来专注于“手语语言学”的研究。

苏剑波教授,从产品开发视角出发,强调了手语识别技术面临的实际挑战。

方昱春教授,同样作为一位CV学者,指出手语识别的复杂性远超人脸识别。

在论坛中,四位教授就手语识别的进展、如何从零开始构建并部署一套高效的手语识别系统、以及大型语言模型在自然语言处理(NLP)领域取得的显著成就对手语识别研究的启示等问题进行了深入探讨。

他们认为,手语识别的主要瓶颈是缺乏通用的大型数据库,而手语识别处理的是视觉方式传达的语义,人类在表达社会生活时,在语义空间中仍有许多共通之处。因此,他们认为大型模型的成功经验可以借鉴,特别是在构建语义空间方面,可能会加速我们对手语理解的研究。

此外,他们也强调了在实际应用中,每次向ChatGPT提问得到的回答都会有所不同,我们可以在缺乏数据的情况下通过关键信息让系统不断自我学习,自我应用。当我们缺乏足够的语言学者和标注人员时,未来实现自动标注可能是解决大数据问题的途径,因为系统可以自适应地学习。

总的来说,这场论坛不仅促进了技术交流,更是跨学科合作的典范。四位教授的深入探讨,为理解听障人士如何与科技融合提供了新的视角,也为手语识别技术的发展提供了宝贵的启示。

原文和模型


【原文链接】 阅读原文 [ 19026字 | 77分钟 ]
【原文作者】 AI科技评论
【摘要模型】 gpt-4-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...