标签:AI模型
Ai2开源OLMo 2:数据集、训练方法、权重大放送
AI研究机构Ai2最近开源了一款名为OLMo 2的大模型,这是一款全面开放的人工智能模型,不仅提供模型权重,还包括工具、数据集和训练配方等开发所需内容。OLMo 2...
OpenAI怒斥Scaling撞墙论!o1已产生推理直觉潜力巨大
OpenAI高级研究副总裁Mark Chen在一次炉边谈话中反驳了关于Scaling Law(规模法则)撞墙的观点。他强调,OpenAI通过o系列和GPT系列模型,成功维持了模型的Sca...
再投40亿美元!亚马逊向OpenAI劲敌Anthropic追加投资
亚马逊向AI初创公司Anthropic额外投资40亿美元,使得其对Anthropic的总投资额达到80亿美元。此次投资后,Anthropic将继续在AWS上训练其旗舰生成式AI模型,并...
发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型
Mistral AI近期推出了其多模态家族的新成员Pixtral Large,这是一个基于124B开放权重构建的超大杯基础模型,具备顶尖的图像理解能力,能够理解文档、图表和自...
「谍战」开启!基建狂魔马斯克122天交付10万卡超算,对手大恐慌派间谍飞机侦查
Elon Musk以其惊人的速度在122天内交付了一台拥有10万卡的超级计算机,这一成就震惊了整个行业,甚至导致竞争对手采取极端措施,如租用飞机进行空中侦查,以...
难以置信,Grok-3证明了黎曼猜想
xAI公司的工程师Hieu Pham在Twitter上宣布,其开发的第三代AI模型Grok-3已成功证明数学界长期悬而未决的黎曼猜想。黎曼猜想由德国数学家波恩哈德·黎曼于1859...
对话Hugging Face王铁震和零一林旅强:中国开源如何更好地被“看见”
在硅星人首届AI创造者大会上,Hugging Face工程师王铁震和零一万物开源负责人林旅强就中国开源工作者关心的话题进行了深入讨论。王铁震介绍了Hugging Face作...
李开复为什么这么忙
李开复,作为零一万物的创始人,近期日程繁忙,频繁参与国内外重要活动和公开演讲,成为外界观察明星公司现状的重要窗口。他以高强度的工作状态,平均每天仅...
全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大
HK-O1aw是由香港生成式人工智能研发中心(HKGAI)的AI for Reasoning团队(HKAIR)与北京大学对齐团队(PKU-Alignment Team)合作推出的全球首个慢思考范式法律推理...
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,基于AlphaGo Zero范式
上海AI Lab团队发布了LLaMA版o1项目,旨在复刻OpenAI的o1推理大模型。该项目采用了蒙特卡洛树搜索、Self-Play强化学习、PPO以及AlphaGo Zero的双重策略范式。...