标签:推理性能

老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

在英伟达的GTC大会上,首席执行官黄仁勋展示了多项突破性技术和产品,涵盖了AI芯片、个人AI超级计算机、开源软件以及自动驾驶等领域。最引人注目的是新一代AI...

16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling

提升大模型推理性能通常依赖于大量数据和算力,但李飞飞团队提出了一种新方法,仅使用1000个样本进行微调,并引入预算强制技术(budget forcing),在测试时...

Kimi、DeepSeek中门对狙?中外开发者大对比还暗讽OpenAI,DeepSeek新涌现被赞爆!

近期,Kimi和DeepSeek两大AI研究机构分别发布了各自的最新模型:Kimi的k1.5和DeepSeek的DeepSeek-R1系列。Kimi 1.5在Github上发布技术报告,获得不到300 star...