大模型

LLM,VLM,模型

ICML 2025放榜!接收率26.9%,高分被拒,低分录用惹争议

第42届国际机器学习大会(ICML)将于2025年7月13日至19日在加拿大温哥华举行。今年大会共收到12107篇投稿,较去年增加了28%,其中3260篇论文被接收,接收率为...

“光靠人盯不住了”!拆解上万张晶圆,这家公司靠AI将芯片良率提升数个百分点

喆塔科技创始人兼 CEO 赵文政对半导体行业的 AI 应用充满信心,认为尽管目前国内真正跑通 AI 的半导体工厂不到 10%,但趋势不可阻挡。半导体工业的 AI 软件赛...

从游戏少女到AI女神!她用物理驯服AI,让飓风预测快1000倍

10岁的Rose Yu在25年前收到一台电脑,这份礼物彻底改变了她的命运。从最初的电脑游戏到网页设计,再到计算机科学的学习,她的兴趣逐渐转向了人工智能(AI)领...

被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作

2015年发布的论文《End-To-End Memory Networks》虽然在当时被Transformer的光芒所掩盖,但它包含了当前大型语言模型的许多关键要素。这篇论文首次完全用注意...

又一开源AI神器!将机器学习论文自动转为可运行代码库

PaperCoder是一个多智能体大语言模型(LLM)系统,旨在自动生成机器学习论文中的代码。这一工具的推出源于对2024年NeurIPS、ICML和ICLR等顶级会议论文的统计...

AI泡沫要破?微软和Meta:继续奏乐继续舞!

微软和Meta在同一天公布了最新季度财报,尽管宏观经济前景不明,两家科技巨头的财报数据均超出了分析师预期,带动各自股价乃至AI股在盘后交易中上涨。微软第...

深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙

DeepSeek-Prover-V2的发布标志着数学推理领域的一次重大突破。该模型通过递归+强化学习的训练方法,显著提升了其在形式化定理证明中的表现。DeepSeek-Prover-...

Windsurf团队关于Agent的认知,相当精彩

Agent 系统的核心概念可以简单理解为一个接受用户输入,并交替执行两种调用的系统:大语言模型(LLM)和工具。LLM 会根据用户输入、上下文信息以及对话内容,...

五一大瓜!英伟达强烈批评Anthropic,造谣中国走私AI芯片

Anthropic在近期发布的报告中指出,中国为获取最新AI芯片,采取了包括“假孕肚”和活龙虾运输在内的非常规手段。这一说法引发了广泛争议,尤其是来自英伟达的强...

DeepSeek开源Prover-V2强推理模型,网友:奥数从没这么简单过

DeepSeek团队在五一劳动节期间发布了DeepSeek-Prover-V2,这是一款专为数学AI编程语言Lean 4打造的开源大语言模型,专注于形式化定理证明。该模型在定理证明...
1 80 81 82 83 84 374