标签:多模态

8人半年肝出开源版GPT-4o,0延迟演示全网沸腾!背后技术揭秘,人人免费用

法国AI实验室kyutai近日发布了一款名为Moshi的实时原生多模态AI模型,该模型在演示中展示了接近GPT-4o水平的性能,引起了广泛关注和AI界大佬的转发。Moshi的...

100天后,阶跃星辰交出了第二份答卷

阶跃星辰公司在2024年全球开发者先锋大会上发布了Step系列通用大模型,包括千亿参数语言大模型Step-1、多模态大模型Step-1V和万亿参数MoE语言大模型Step-2预...

哈佛、麻省推出面向医学多模态助手—PathChat

哈佛医学院、麻省理工学院和俄亥俄州立大学韦克斯纳医学中心的研究人员联合开发了一款名为PathChat的多模态AI助手,专为医学领域设计。PathChat通过整合视觉...

炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流

科大讯飞的讯飞星火4.0版本在语音识别和多模态能力方面取得了显著进步。在强干扰环境下,如多人同时说话和背景音乐,讯飞星火4.0能够准确识别并转化为文字,...

对话杨植麟:聚焦生产力,做好 Kimi 这一个产品

在AGI Playground 2024上,极客公园创始人&总裁张鹏与月之暗面Kimi创始人&CEO杨植麟进行了深入对话,分享了Kimi的发展历程、目标定位以及对长文本和多模态技...

揭秘大模型技术在快手搜索的应用

快手搜索部门技术专家许坤在QCon 2024北京的分享中,深入探讨了大模型技术在快手搜索领域的应用,特别是多模态理解和生成方面的最新科研进展。许坤介绍了快手...

ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据

Epochai发布了一份关于大语言模型(LLM)训练数据消耗的研究报告,指出目前全球公开的高质量文本训练数据集约为300万亿tokens。然而,随着像ChatGPT这样的模...

又一届「AI春晚」拉开序幕!智源大模型集体爆发了

2024年智源大会展示了人工智能领域的最新进展和成就,特别是大模型技术在多个行业的应用。会议聚集了众多AI专家,包括Llama、Sora等大模型的开发者,以及百度...

规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果

智源研究院在过去一年中举办的最大国内AI盛会“中国AI春晚”上,展示了他们在大模型领域的最新进展。这些进展包括:1. 语言智能与视觉智能融合创造世界模拟器:...

不要小看「实而不华」的腾讯 AI

在国内人工智能领域,腾讯以其低调但扎实的方式推动AI基础设施建设、产业生态构建,并在原有业务中探索AI应用,取得了显著成果。上周,腾讯在两场发布会上公...
1 6 7 8 9 10 17