标签:AI模型

DeepSeek R1 API实测,哪家服务商最靠谱?

国内云平台对DeepSeek R1/V3模型的服务质量呈现显著差异,测试发现关键性能指标直接影响实际应用效果。区分供应商的核心标准包括模型版本真实性、上下文窗口...

十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!

OpenAI首席执行官萨姆·奥特曼近日公布了公司最新AI模型发展路线图,宣布将推出GPT-4.5和GPT-5两款新模型。根据其“周/月”的时间框架暗示,GPT-4.5或将在数周内...

OpenAI自曝GPT-4.5马上发布、GPT-5免费无限用,推理模型o3-mini或成为绝唱|钛媒体AGI

OpenAI首席执行官萨姆·奥尔特曼宣布了GPT-4.5和GPT-5的发布计划,标志着公司技术路线图的重大调整。代号'猎户座'的GPT-4.5将在数周至数月内推出,成为最后一...

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

来自字节跳动、北京大学等机构的研究者提出了Sa2VA模型,这是首个结合SAM-2和LLaVA-like架构的视频多模态大模型。该模型通过整合时空细粒度理解能力,实现了...

DeepSeek劝不了谷歌们

过去一个月,DeepSeek以较低成本推出性能接近OpenAI o1的开源模型R1,引发了全球AI行业的震动。这一“小力出奇迹”的新范式挑战了行业对高昂研发成本的依赖,但...

今年,还要抢GPU?

近期国内AI初创公司DeepSeek凭借开源大模型DeepSeek-V3和DeepSeek-R1引发关注,其性能与GPT-4等顶级模型相当,但训练成本仅为560万美元,显著低于行业平均的1...

人类自愧不如 :DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评,AI们比你脑子清楚多了

本次评测针对o3-mini、DeepSeek R1和Gemini 2.0 Flash Thinking三款推理模型展开七项核心任务测试。逻辑推理测试中,三款模型均正确解答阶乘数列问题,但思维...

不断有人在问,这个中国模型到底有什么魔力?

低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...

DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...

DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页

随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...
1 3 4 5 6 7 20