标签:多模态模型

跟科幻片一样!OpenAI只用13天给机器人加上了GPT,从此无比“接近人类”

文章介绍了硅谷火遍的人形机器人Figure 01,由OpenAI支持,展示了其具备看、听、对话等能力的最新demo。这个机器人通过自我学习而不是远程操作,展示了识别环...

万字梳理:阿里、腾讯等8家中国互联网大厂的50款大模型及应用,能否全面超越GPT-4? | 钛媒体AGI

自OpenAI推出ChatGPT以来,全球科技巨头纷纷加速布局AI大模型领域。钛媒体AGI整理了2023年以来,包括阿里巴巴、百度、字节跳动、腾讯、华为等在内的8家科技公...

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

程博文是一位华人科学家,曾在特斯拉自动驾驶部门工作,最近宣布将加入OpenAI的后训练团队,专注于多模态模型的研究。他毕业于伊利诺伊大学厄巴纳-香槟分校,...

前端不存在了?盲测64%的人更喜欢GPT-4V的设计,杨笛一等团队新作

在最近的央视节目中,百度CEO李彦宏预测了编程语言的未来,认为未来只会存在两种编程语言:英文和中文。这一观点基于大模型技术突破后,自动化趋势在各行各业...

Claude 3 惊喜上线:多模态能力比肩 GPT-4V

Anthropic公司近期推出了Claude 3,这是一款备受瞩目的多模态模型,被认为是ChatGPT的强大竞争对手。Claude 3包含三个不同的版本:Opus、Sonnet和Haiku,分别...

OpenAI的AGI梦:AI的“大脑”将何时到来?

文章讨论了OpenAI计划在2027年前开发出通用人工智能(AGI)的目标。AGI将能够执行任何人类能做的智力任务。文章详细介绍了OpenAI的训练过程,包括其多模态模...

OpenAI与谷歌回答了我们经典的“钱学森之问”,讽刺吗?

文章主要讨论了OpenAI发布的Sora引擎和谷歌发布的Gemini 1.5引擎这两个人工智能技术的强大功能及其对未来可能带来的影响。作者对技术进步表示赞叹的同时,也...

微软37页论文逆向工程Sora,得到了哪些结论?

摘要:本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频的模型,它在视觉质量...

为什么说Sora是世界的模拟器?

Sora:物理世界的模拟器OpenAI的Sora模型,一个能够生成逼真视频的AI系统,被冠以“世界的模拟器”的称号。它不仅在视频生成领域取得了突破,更在模拟物理世界...

谷歌发布旗下最强大模型Gemini Ultra,Bard更名Gemini、还有Gemini App和包月套餐

北京时间2月8日21点,谷歌宣布了其旗下最强大的多模态模型Gemini的最新进展,包括三个不同规模的模型:最大的Ultra、中等规模的Pro、以及最小的Nano。这一系...
1 3 4 5 6