大模型

LLM,VLM,模型

「Next-Token」范式改变!刚刚,强化学习预训练来了

在人工智能领域,强化学习(RL)长期以来被视为提升模型能力的辅助工具,而非核心方法。然而,近年来,强化学习在提升大语言模型(LLMs)能力方面的作用逐渐...

一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。

在火山引擎发布会上,展示了多项前沿技术,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型以及端到端语音模型等。其中,Seedance 1.0 p...

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

欧洲人工智能公司Mistral AI近期发布了全新的大语言模型系列Magistral,该系列展现了强大的推理能力,能够通过不断反思解决更复杂的任务。Magistral系列包含...

华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群

华为首次推出了一项名为“数字化风洞”的技术,旨在通过虚拟环境平台在正式训练和推理复杂AI模型之前进行预演,从而优化资源配置并减少算力浪费。该技术由华为...

我们跟美团技术的同学聊了聊“NoCode”的背后,顺手用它搭了个社区……

骆轶航作为一家专注于AI的科技内容社区的CEO,分享了他在AI编程工具NoCode上的体验与思考。尽管他并非技术背景出身,但通过AI工具,他能够快速生成前端页面,...

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

Mistral AI发布了其首款推理模型Magistral,该模型旨在提升多语言推理能力和可解释性。Magistral分为两个版本:Magistral Small,一个24B参数的开源权重版本...

刚刚!奥尔特曼终极手工“小作文”称未来10年AI将变革一切,不点名骂马斯克“如此卑鄙”

OpenAI近期发布了其最强推理型AI模型o3-pro,并将价格大幅下调80%,使其与GPT-4o持平。这一举措显著降低了高性能AI的使用门槛,可能加速AI技术的普及。与此同...

OpenAI深夜突发o3-Pro,价格暴降80%,史上最强模型来了

OpenAI于今日凌晨宣布向ChatGPT和API中的所有Pro用户提供其最新、最强大的模型o3-Pro。该模型具备多项先进功能,包括自动调用多种工具进行网页搜索、文件分析...

AI 创业者的反思:那些被忽略的「快」与「长」

周喆吾在分享其创业经验时,强调了AI创业中两个关键因素:速度和长文本上下文处理能力。他指出,快是用户体验的核心,尤其是在AI产品中,用户习惯会被便捷性...

大模型热度退潮,真正的技术创新者开始被「看见」

近年来,大模型领域的竞争格局发生了显著变化,从盲目追逐规模转向更注重技术本质的创新。过去两年中国的大模型投资更多聚焦商业模式,而硅谷则倾向于押注技...
1 44 45 46 47 48 371