标签:多模态
哈佛、麻省推出面向医学多模态助手—PathChat
哈佛医学院、麻省理工学院和俄亥俄州立大学韦克斯纳医学中心的研究人员联合开发了一款名为PathChat的多模态AI助手,专为医学领域设计。PathChat通过整合视觉...
炸裂!讯飞现场大秀强干扰语音识别,星火4.0霸榜八个榜单,74种语言自由交流
科大讯飞的讯飞星火4.0版本在语音识别和多模态能力方面取得了显著进步。在强干扰环境下,如多人同时说话和背景音乐,讯飞星火4.0能够准确识别并转化为文字,...
对话杨植麟:聚焦生产力,做好 Kimi 这一个产品
在AGI Playground 2024上,极客公园创始人&总裁张鹏与月之暗面Kimi创始人&CEO杨植麟进行了深入对话,分享了Kimi的发展历程、目标定位以及对长文本和多模态技...
揭秘大模型技术在快手搜索的应用
快手搜索部门技术专家许坤在QCon 2024北京的分享中,深入探讨了大模型技术在快手搜索领域的应用,特别是多模态理解和生成方面的最新科研进展。许坤介绍了快手...
ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据
Epochai发布了一份关于大语言模型(LLM)训练数据消耗的研究报告,指出目前全球公开的高质量文本训练数据集约为300万亿tokens。然而,随着像ChatGPT这样的模...
又一届「AI春晚」拉开序幕!智源大模型集体爆发了
2024年智源大会展示了人工智能领域的最新进展和成就,特别是大模型技术在多个行业的应用。会议聚集了众多AI专家,包括Llama、Sora等大模型的开发者,以及百度...
规格拉满!Llama和Sora作者都来刷脸的中国AI春晚,还开源了一大堆大模型成果
智源研究院在过去一年中举办的最大国内AI盛会“中国AI春晚”上,展示了他们在大模型领域的最新进展。这些进展包括:1. 语言智能与视觉智能融合创造世界模拟器:...
不要小看「实而不华」的腾讯 AI
在国内人工智能领域,腾讯以其低调但扎实的方式推动AI基础设施建设、产业生态构建,并在原有业务中探索AI应用,取得了显著成果。上周,腾讯在两场发布会上公...
Sam Altman:GPT-4o幕后揭秘,GPT-5会很特别
在最近的一次专访中,OpenAI首席执行官Sam Altman与红点风险投资公司董事总经理Logan Bartlett讨论了GPT-4o的幕后技术以及未来产品的展望。GPT-4o作为一个多...
杀疯了!地表最强模型GPT-4o登场,速度提升200%、价格便宜50%,或将颠覆实时翻译等行业|钛媒体AGI
美国OpenAI公司在5月14日的春季ChatGPT发布会上推出了全新的旗舰AI模型GPT-4o,该模型能够实时进行音频、视觉和文本推理。GPT-4o的发布在谷歌Google I/O开发...