DeepMind前员工创立的AI公司发布新模型,能理解音频与视频,推理性能超过Gemini

AIGC动态8个月前发布 damoxingLab
730 0 0
DeepMind前员工创立的AI公司发布新模型,能理解音频与视频,推理性能超过Gemini

 

文章摘要


【关 键 词】 Reka多模态语言模型AI初创竞争优势

Reka是一家总部位于旧金山的AI初创公司,由来自DeepMind、Google和Meta的研究人员联合创立,最近推出了一款名为Reka Core的全新多模态语言模型

这款模型被誉为公司“最大且最强的模型”,通过使用数千个GPU从头开始进行训练。Reka Core现已通过API、本地部署或端侧部署的形式提供。

作为Reka语言模型家族中的第三个成员,Reka Core能够理解包括图像、音频和视频在内的多种模态。尽管这款模型在不到一年的时间内完成训练,其性能达到甚至超过了包括OpenAI、Google和Anthropic在内的多家财力雄厚的顶尖AI企业。

公司共有22人,CEO Dani Yogatama表示,这种在极短时间内培训出高性能模型的能力,使得公司在竞争中独树一帜。

Reka在Netflix的“三体问题”上测试了其Reka Core多模态语言模型,它能够将屏幕上发生的事情翻译成文本。Yi Tay,Reka首席科学家兼联合创始人,在X上写道,公司动用了“数千台H100”来研发Reka Core。

Reka Core是一个“超大型模型”,结合了公开数据、授权数据及涉及文本、音频、视频和图像的合成数据,采用多源训练方式。该模型支持32种语言,拥有128,000 Token的上下文窗口,能够一次性处理大量多样的信息,非常适用于处理长文档。

Reka希望为来自电子商务、游戏、医疗保健和机器人技术等不同行业的客户开启新的独特应用场景。公司已经开始与行业合作伙伴及组织合作,扩大其模型的应用范围。

原文和模型


【原文链接】 阅读原文 [ 1429字 | 6分钟 ]
【原文作者】 AI大模型实验室
【摘要模型】 gpt-3.5-turbo-0125
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...