DeepMind前员工创立的AI公司发布新模型，能理解音频与视频，推理性能超过Gemini

AIGC动态1年前 (2024)发布 damoxingLab

2,090 0 0

DeepMind前员工创立的AI公司发布新模型，能理解音频与视频，推理性能超过Gemini

文章摘要

Reka是一家总部位于旧金山的AI初创公司，由来自DeepMind、Google和Meta的研究人员联合创立，最近推出了一款名为Reka Core的全新多模态语言模型。

这款模型被誉为公司“最大且最强的模型”，通过使用数千个GPU从头开始进行训练。Reka Core现已通过API、本地部署或端侧部署的形式提供。

作为Reka语言模型家族中的第三个成员，Reka Core能够理解包括图像、音频和视频在内的多种模态。尽管这款模型在不到一年的时间内完成训练，其性能达到甚至超过了包括OpenAI、Google和Anthropic在内的多家财力雄厚的顶尖AI企业。

公司共有22人，CEO Dani Yogatama表示，这种在极短时间内培训出高性能模型的能力，使得公司在竞争中独树一帜。

Reka在Netflix的“三体问题”上测试了其Reka Core多模态语言模型，它能够将屏幕上发生的事情翻译成文本。Yi Tay，Reka首席科学家兼联合创始人，在X上写道，公司动用了“数千台H100”来研发Reka Core。

Reka Core是一个“超大型模型”，结合了公开数据、授权数据及涉及文本、音频、视频和图像的合成数据，采用多源训练方式。该模型支持32种语言，拥有128,000 Token的上下文窗口，能够一次性处理大量多样的信息，非常适用于处理长文档。

Reka希望为来自电子商务、游戏、医疗保健和机器人技术等不同行业的客户开启新的独特应用场景。公司已经开始与行业合作伙伴及组织合作，扩大其模型的应用范围。

原文和模型

【原文链接】 阅读原文 [ 1429字 | 6分钟 ]
【原文作者】 AI大模型实验室
【摘要模型】 gpt-3.5-turbo-0125
【摘要评分】 ★★☆☆☆

OpenAI ChatGPT

ChatGPT是OpenAI公司开发的一种大型语言模型。它是一种基于Transformer架构的深度学习模型，可以对语言进行建模和生成。它可以处理问答、对话生成、文本生成等多种任务。

# AIGC动态 # 图像生成 # 大模型 # 机器人 # 视频生成 # 音频生成 # AI初创 # Reka # 多模态 # 竞争优势 # 语言模型

文章版权归作者所有，未经允许请勿转载。

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

新智元

2,178

OpenAI 发布实时 API，AI 实时语音时代如何抢占风口？

极客公园

2,121

从 YC W24 看硅谷 AI 创业新趋势：AI Agent、垂直领域、多模态和 AI 安全

Founder Park

3,407

国产大模型创业一哥：秀商业化，布局Sora，“全线对标OpenAI”

量子位

2,177

豆包大模型“考上”清北的背后

硅星人Pro

961

量子位

1,738

暂无评论

暂无评论...

DeepMind前员工创立的AI公司发布新模型，能理解音频与视频，推理性能超过Gemini

文章摘要

原文和模型

王传福的神预言：合资份额将不足10%，日系已无力还手

李飞飞团队年度报告揭底大模型训练成本：Gemini Ultra是GPT-4的2.5倍

相关文章

暂无评论

热门网址

热门文章

DeepMind前员工创立的AI公司发布新模型，能理解音频与视频，推理性能超过Gemini

文章摘要

原文和模型

王传福的神预言：合资份额将不足10%，日系已无力还手

李飞飞团队年度报告揭底大模型训练成本：Gemini Ultra是GPT-4的2.5倍

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章