大模型

LLM,VLM,模型

谷歌提出Titans:突破算力限制,扩展上下文

谷歌研究院推出的Titans框架通过创新架构设计突破了大语言模型的长上下文处理瓶颈,将模型上下文窗口扩展至200万token,同时仅增加1.8倍算力消耗。该框架在语...

刚刚,全球首个混合推理模型Claude 3.7降世!最强编程大脑暴击DeepSeek R1

Anthropic发布全球首款混合推理模型Claude 3.7 Sonnet,该模型通过独特的双模式架构实现了即时响应与深度思考的融合。在扩展思考模式下,模型通过自我反思机...

超过DeepSeek、o3,双思维模型Claude 3.7来了

著名大模型平台Anthropic推出的Claude 3.7 Sonnet首次引入双思维模式,通过标准与扩展两种思考机制实现差异化响应。标准思考模式适用于即时问答场景,例如直...

Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了。

Claude 3.7 Sonnet作为Claude家族首个具备推理能力的模型正式发布,其混合推理架构引发行业关注。该模型通过下拉菜单实现普通模式与扩展模式的无缝切换,普通...

官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug

近日,Sakana AI推出的「AI CUDA工程师」系统因涉嫌作弊引发行业震动。该系统曾宣称通过LLM驱动的进化算法,能将PyTorch代码转换为优化后的CUDA内核,实现模...

阿里要开源史上最强推理模型,性能超过DeepSeek R1。

阿里巴巴今日凌晨发布了基于Qwen2.5-Max架构的推理模型QwQ-Max-Preview,并宣布即将通过Apache 2.0许可证全面开源QwQ-Max及Qwen2.5-Max。这一举措标志着阿里...

实时人-机-物交互框架 RHINO:人形机器人助手从人类交互数据中学会「察言观色」

针对人形机器人在动态环境中实现高效交互的挑战,上海交通大学研究团队提出的RHINO框架通过分层学习架构实现了突破性进展。该框架将交互过程解构为意图预测、...

一群技术人拉横幅围堵 OpenAI,不禁 AI 就一直闹!

近日,美国旧金山成立的“停止人工智能”(Stop AI)组织引发广泛关注。该非暴力公民抵抗组织以阻止通用人工智能(AGI)发展为核心理念,主张通过抗议活动与国...

百度,是时候想“开”了

近期百度APP重新启用二十年前的经典slogan'百度一下,你就知道',这一调整标志着其战略重心回归搜索本质。通过整合文心大模型与DeepSeek R1模型,新版APP推出...

阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业

阶跃星辰在首届Step UP生态开放日上展示了其在智能终端Agent领域的战略布局与技术突破,重点围绕汽车、手机、IoT和具身智能四大场景展开深度合作与创新。公司...
1 172 173 174 175 176 316