标签:模型
蚂蚁武威:下一代「推理」模型范式大猜想
长思维链作为深度思考的一种实现方式,近年来成为研究下一代基础模型推理能力的热门方向。尽管R1模型展示了强大的性能,但其高维度和高能量的特性导致系统不...
OpenAI放了一个重磅大招,AI医疗已经提上日程。
OpenAI 今天正式发布了全新的开源健康基准 HealthBench,旨在评估大模型在真实医疗场景中的表现。HealthBench 由 262 名医生共同开发,涵盖 5000 个多轮医疗...
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
字节跳动首次开源了其代码模型Seed-Coder,该模型规模为8B,超越了Qwen3,并在多个基准测试中取得了领先地位。Seed-Coder通过自身生成和筛选高质量训练数据,...
微软开源新版ph4:媲美DeepSeek-R1,参数暴降48倍
微软近期在官网开源了三个新版Phi-4小参数模型,分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低,能够在消费级硬件...
OpenAI终于把自家六款模型的使用场景说清楚了。
通过这些模型,用户可以根据具体任务需求选择最合适的工具,从而提高工作效率和成果质量。
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
谷歌最新发布的Gemini 2.5 Pro Preview(I/O版)在多个领域取得了显著突破,尤其是在编程、视觉和文本处理方面表现卓越。该模型在LMeana基准测试中斩获三连冠...
超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光
英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1,并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...
只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模...
刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」
OpenAI 最近因 GPT-4o 模型表现出“过度谄媚”的行为而引发了广泛关注。这一问题导致 OpenAI 决定回滚 GPT-4o 的最新更新,并采取了一系列措施来修复模型的个性...