标签:多模态
a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态
Adam D'Angelo,Meta的前CTO和Quora的CEO,目前还是OpenAI的董事会成员。他最近推出了Poe,这是一个集成了多个大型语言模型(LLMs)的聊天机器人平台,包括GP...
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
上海交通大学与上海AI实验室合作提出了一种新的框架——Long-CLIP,旨在解决CLIP模型在处理长文本时的不足。CLIP模型通过对齐视觉和文本模态,具备强大的zero-s...
关于 RAG、AI Agent、多模态,我们的理解与探索
在QCon上海站上,王元讲师分享了关于构建企业级智能问答机器人的实战经验,探讨了私有数据接入、代理框架运用、多模态实践和语义缓存技术等LLM新技术与实践。...
阶跃星辰:大模型「new game」里的新玩家
在2024年3月23日的全球开发者先锋大会上,初创公司阶跃星辰发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型和Step-2...
通用文档理解新SOTA,多模态大模型TextMonkey来了
华中科技大学和金山的研究人员在多模态大模型Monkey的基础上提出了TextMonkey,这是一个专注于文本相关任务的多模态大模型。TextMonkey在多个场景文本和文档...
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
剑桥大学信息工程系人工智能实验室最近开源了首个预训练、通用多模态后期交互知识检索器PreFLMR。该模型基于Fine-grained Late-interaction Multi-modal Retr...
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑
这篇新智元报道介绍了一种名为3D-VLA(3D视觉-语言-动作)的新型生成式视觉-语言-行动模型,该模型在多项任务中显著提高了推理、多模态生成和规划的能力。与...
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型
这篇文章报道了人工智能领域的最新发展趋势,特别关注了生成式 AI 模型在多模态方面的进展以及未来的发展方向。斯坦福大学教授吴恩达指出,AI 智能体工作流将...
一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V
,正式向开发者开放,推出了三款强大的,以促进生态发展和模型在更多应用场景的落地。这三款模型包括:(支持通用聊天、问答、对话、写作、翻译等功能)、(2...
零一万物 API 上线,用户反馈多模态中文图表体验超过 GPT-4V
零一万物公司近日发布了Yi大模型API开放平台,为开发者提供通用Chat、200k超长上下文、多模态交互等模型。零一万物由李开复创办于2023年6月,成功发布了Yi系...