大模型

谷歌提出Titans：突破算力限制，扩展上下文

谷歌研究院推出的Titans框架通过创新架构设计突破了大语言模型的长上下文处理瓶颈，将模型上下文窗口扩展至200万token，同时仅增加1.8倍算力消耗。该框架在语...

AIGC动态

6个月前

Anthropic发布全球首款混合推理模型Claude 3.7 Sonnet，该模型通过独特的双模式架构实现了即时响应与深度思考的融合。在扩展思考模式下，模型通过自我反思机...

AIGC动态

6个月前

著名大模型平台Anthropic推出的Claude 3.7 Sonnet首次引入双思维模式，通过标准与扩展两种思考机制实现差异化响应。标准思考模式适用于即时问答场景，例如直...

AIGC动态

6个月前

Claude 3.7 Sonnet作为Claude家族首个具备推理能力的模型正式发布，其混合推理架构引发行业关注。该模型通过下拉菜单实现普通模式与扩展模式的无缝切换，普通...

AIGC动态

6个月前

近日，Sakana AI推出的「AI CUDA工程师」系统因涉嫌作弊引发行业震动。该系统曾宣称通过LLM驱动的进化算法，能将PyTorch代码转换为优化后的CUDA内核，实现模...

AIGC动态

6个月前

阿里巴巴今日凌晨发布了基于Qwen2.5-Max架构的推理模型QwQ-Max-Preview，并宣布即将通过Apache 2.0许可证全面开源QwQ-Max及Qwen2.5-Max。这一举措标志着阿里...

AI-Agent

6个月前

针对人形机器人在动态环境中实现高效交互的挑战，上海交通大学研究团队提出的RHINO框架通过分层学习架构实现了突破性进展。该框架将交互过程解构为意图预测、...

AIGC动态

6个月前

近日，美国旧金山成立的“停止人工智能”（Stop AI）组织引发广泛关注。该非暴力公民抵抗组织以阻止通用人工智能（AGI）发展为核心理念，主张通过抗议活动与国...

AIGC动态

6个月前

近期百度APP重新启用二十年前的经典slogan'百度一下，你就知道'，这一调整标志着其战略重心回归搜索本质。通过整合文心大模型与DeepSeek R1模型，新版APP推出...

AIGC动态

6个月前

阶跃星辰在首届Step UP生态开放日上展示了其在智能终端Agent领域的战略布局与技术突破，重点围绕汽车、手机、IoT和具身智能四大场景展开深度合作与创新。公司...

AI-Agent

6个月前