标签:多模态

“新王登基”!Claude 3 横空出世,最强大模型易主 | 大模型一周大事

本文主要介绍了过去一周大模型行业的重大事件和最新动态

​前谷歌大佬离职创业,不到一年造出GPT3.5和Gemini Pro,惨痛忠告:GPU简直菜鸡,就像是买彩票!

前谷歌高级研究科学家Yi Tay离职后成立了大模型公司Reka,不到一年时间,便从零开始训练出了能与GPT3.5匹敌的大模型Reka,以及多模态大模型Gemini Pro。Yi Ta...

AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了

Anthropic于3月4日晚发布了新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模。Sonnet版本可免费体验,而最强的Opus版本需付费订阅,...

全面超越GPT-4,Claude 3终于来了,有大学生智商,支持百万token

摘要:文章介绍了OpenAI的竞争对手Anthropic发布的新一代AI大模型系列Claude 3,其中Opus模型在多项基准测试中表现超过了GPT-4和Gemini 1.0 Ultra,树立了新...

复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持

模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★   文章摘要 【关 键 词】 机器之心、Sora、多模态、AnyGPT...

机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

在本周的大模型行业动态中,InfoQ 研究中心为我们带来了一系列令人兴奋的进展。英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 和 Sanctuary AI 的 Phoeni...

大模型的发展方向,Chatgpt?AI Agent?两万字深度思考!

本文是李博杰在知乎分享的关于AI Agent的全面介绍和总结。文章首先回顾了ChatGPT发布两年来的发展,特别是大模型从文字对话扩展到文生视频的能力。作者分享了...

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

Ideogram是一款新兴的文生图工具,它在文字渲染能力上表现出色,成功获得了8000万美元的融资。这款工具能够根据用户的提示生成带有自然悬浮文字或立体文字的...

商汤全球首创「日日新SenseNova 4.0」惊天大模型!彻底颠覆你的AI体验

近日,中国人工智能企业商汤宣布推出全球首个多模态大型模型“日日新SenseNova 4.0”。该模型能同时处理文本、图像、音频等不同形式的数据,并在多项任务上超越...

谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?

Gemini 1.5 Pro 测评摘要:谷歌推出的Gemini 1.5 Pro模型在多模态数据处理方面展现出了显著的能力,尤其是在处理超长上下文方面。该模型能够处理高达100万tok...
1 8 9 10 11 12