大模型

LLM,VLM,模型

21 页 PDF 实锤 Grok 3“套壳”Claude?Grok 3 玩自曝,xAI工程师被喷无能!

近日,一位名为GpsTracker的网友爆料称,埃隆·马斯克旗下xAI公司发布的Grok 3人工智能模型在“思考模式”下表现出异常行为,自称是竞争对手Anthropic公司开发的...

印度国家级大模型上线两天仅 300 余次下载,投资人直呼“尴尬”:韩国大学生模型都有20万!

Sarvam AI作为印度“IndiaAI Mission”国家级项目的首批入选公司,近期发布了名为Sarvam-M的240亿参数混合语言模型,被视为印度本土AI研究的一项突破。该模型基...

智元机器人发布并开源首个机器人动作序列驱动的世界模型

智元机器人近日发布了具身智能领域的两项重要突破:全球首个基于机器人动作序列驱动的具身世界模型 EVAC(EnerVerse-AC),以及具身世界模型评测基准 EWMBenc...

微软副总裁X上「开课」,连更关于RL的一切,LLM从业者必读

微软副总裁 Nando de Freitas 在 X 平台上发布了一系列关于人工智能教育的帖子,内容涵盖大语言模型(LLM)的强化学习、扩散模型、流匹配等技术。他通过深入...

硅谷顶级AI天才成「团宠」:布林请吃饭,奥特曼约打牌

硅谷科技巨头正掀起一场前所未有的AI人才争夺战,OpenAI、谷歌、xAI等公司不惜重金,争夺能够改变游戏规则的顶尖AI研究人员。OpenAI为留住人才,开出了高达20...

华为中科大联创大模型低比特量化算法,1‰数据实现昇腾无损压缩7倍

大模型在人工智能领域展现出强大的能力,但其庞大的参数量和部署成本成为广泛应用的主要障碍。以DeepSeek-R1 671B为例,其推理过程需要高达1342GB的显存,即...

Gartner:到2029年,50%的云计算将用于AI工作负载

全球著名咨询机构Gartner发布了未来四年影响云计算增长的几大趋势,涵盖了对云的不满、AI/机器学习需求增加、多云和跨云、行业解决方案、数字主权和可持续性...

专访微软CTO:微软大力发展Agent,智能体将无处不在

微软首席技术官Kevin Scott在“Build2025”大会期间接受专访,深入探讨了智能体(Agent)技术的发展及其在微软生态系统中的应用。Scott强调,智能体作为下一代...

小米 15S Pro 上手:一颗自研3nm芯片,能否重塑小米?

小米最新推出的旗舰手机小米 15S Pro,搭载了自主研发的 3nm 工艺芯片玄戒 O1,标志着国产手机厂商在芯片领域迈出了重要一步。玄戒 O1 采用第二代 3nm 工艺,...

AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了?

Vending-Bench模拟环境旨在测试大模型在管理自动售货机业务中的表现,结果显示Claude 3.5 Sonnet在净资产和运营稳定性上表现最佳,而人类参与者的表现则位居...
1 7 8 9 10 11 605