标签:AI模型
DeepSeek R1 API实测,哪家服务商最靠谱?
国内云平台对DeepSeek R1/V3模型的服务质量呈现显著差异,测试发现关键性能指标直接影响实际应用效果。区分供应商的核心标准包括模型版本真实性、上下文窗口...
十多个模型打不过 DeepSeek 一个?奥特曼受不了了:怒将 GPT 和 o系列合并,非思维链模型到头!
OpenAI首席执行官萨姆·奥特曼近日公布了公司最新AI模型发展路线图,宣布将推出GPT-4.5和GPT-5两款新模型。根据其“周/月”的时间框架暗示,GPT-4.5或将在数周内...
OpenAI自曝GPT-4.5马上发布、GPT-5免费无限用,推理模型o3-mini或成为绝唱|钛媒体AGI
OpenAI首席执行官萨姆·奥尔特曼宣布了GPT-4.5和GPT-5的发布计划,标志着公司技术路线图的重大调整。代号'猎户座'的GPT-4.5将在数周至数月内推出,成为最后一...
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA
来自字节跳动、北京大学等机构的研究者提出了Sa2VA模型,这是首个结合SAM-2和LLaVA-like架构的视频多模态大模型。该模型通过整合时空细粒度理解能力,实现了...
DeepSeek劝不了谷歌们
过去一个月,DeepSeek以较低成本推出性能接近OpenAI o1的开源模型R1,引发了全球AI行业的震动。这一“小力出奇迹”的新范式挑战了行业对高昂研发成本的依赖,但...
今年,还要抢GPU?
近期国内AI初创公司DeepSeek凭借开源大模型DeepSeek-V3和DeepSeek-R1引发关注,其性能与GPT-4等顶级模型相当,但训练成本仅为560万美元,显著低于行业平均的1...
人类自愧不如 :DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评,AI们比你脑子清楚多了
本次评测针对o3-mini、DeepSeek R1和Gemini 2.0 Flash Thinking三款推理模型展开七项核心任务测试。逻辑推理测试中,三款模型均正确解答阶乘数列问题,但思维...
不断有人在问,这个中国模型到底有什么魔力?
低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...
DeepSeek技术解析:如何冲击英伟达两大壁垒?
DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...
DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页
随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...