大模型

LLM,VLM,模型

测试「天下最聪明」的 Grok3:它真的是模型边际效应的终点吗?

马斯克与xAI团队发布的Grok3模型在基准测试中宣称超越主流AI系统,但其实际表现引发广泛质疑。在基础数学与物理问题测试中,Grok3未能正确回答'9.11与9.9大小...

清华、中南开源3D交互实体AI Agent LEGENT

清华大学与中南大学联合研发的LEGENT模型,通过构建可视化3D交互实体AI代理系统,突破了传统AI Agent无实体交互的局限。该系统由场景、智能体与界面三大核心...

全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

OpenAI近日开源了名为SWE-Lancer的新型大模型代码能力评估基准,该测试基准通过真实软件开发任务和端到端测试方法,为评估大语言模型的工程实践能力提供了新...

独家对话刘知远:AGI 是一场技术理想与商业现实的「持久战」

面壁智能作为中国最早的大模型团队之一,其发展轨迹揭示了技术创新与资本认知间的深刻矛盾。团队自2021年参与北京智源「悟道」项目起,便致力于推动大模型开...

跟硅谷AI新星聊了一圈后,我们发现了中美创业的不同,以及突围点

硅谷之行的观察显示,中美技术代差显著缩小。锦秋基金合伙人臧天宇指出,大语言模型的预训练阶段已接近尾声,视频模型技术路线尚未收敛,具身智能仍处早期探...

2024年出海AI产品盘点:最高月入千万美金,日本市场成“香饽饽”

2024年中国AI创业公司加速全球化布局,教育、娱乐和生产力工具领域涌现出多个高流量、高收入的出海产品。日本市场成为国内AI企业出海的意外热点,以会议转录...

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

马斯克旗下xAI团队于2025年2月18日正式发布Grok 3模型,宣称其通过20万张英伟达H100 GPU集群实现了计算资源的十倍扩容。Colossus超级计算机仅用八个月完成搭...

Grok3省流版:AI大佬Andrej Karpathy的真实点评

马斯克的AI初创公司xAI最新推出的大模型Grok3,经AI专家Andrej Karpathy两小时深度测试后,展现出与行业顶尖模型相抗衡的能力。在核心的思考模式测试中,Grok...

Grok3 来了,马斯克笑了,网站崩溃了

伊隆·马斯克领导的xAI团队正式发布新一代人工智能系统Grok3,宣称其综合能力达到行业领先水平。该系统包含基础模型、推理模型及首个智能体产品「Deep Search...

大决战!OpenAI可能发布GPT-4.5,狙击马斯克Grok3

凌晨1点,OpenAI首席执行官Sam Altman透露GPT-4.5测试版已展现出超越预期的AGI特性体验,暗示该模型即将结束测试进入正式发布阶段。这一动态与马斯克旗下公司...
1 14 15 16 17 18 502