标签:大模型

2025年全球AI指数报告

斯坦福大学HAI研究中心发布的《2025年AI指数报告》对全球AI发展趋势进行了全面分析,涵盖了技术、经济、环境等多个维度。报告指出,中美两国在大模型领域的竞...

原生多模态大模型也能强化学习,思维链长达几万字,商汤日日新V6来了

商汤推出的「日日新 SenseNova V6」大模型在多模态推理与交互能力上展现了行业领先水平。该模型通过多模态长思维链训练、全局记忆、强化学习等技术突破,显著...

AI看柯南2分钟揪真凶,商汤600B多模态MoE推理封神!交互记忆全线升级

商汤科技最新发布的第六代大模型SenseNova V6,标志着多模态大模型技术的重大突破。该模型不仅在文本、图像和视频的原生融合上实现了全面升级,还展现了强大...

阿里云又干了一件大事

阿里云百炼平台宣布全面支持MCP(大模型通用接口),成为业内首个提供全生命周期MCP服务的平台。这一举措为AI应用开发者带来了显著利好,能够大幅降低开发成...

大模型一体机塞进这款游戏卡,价格砍掉一个数量级

大模型一体机中使用的显卡类型引发了广泛关注,尤其是英特尔锐炫™显卡的引入,为市场带来了新的选择。尽管在性能上,搭载NVIDIA显卡的一体机在任务处理速度上...

阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent

在阿里云AI势能大会上,阿里云智能集团资深副总裁刘伟光介绍了AI大模型在企业市场中的最新应用成果和趋势。AI大模型在咖啡店的应用不仅限于设计宣传海报或制...

拿 20 年前的苹果“古董”笔记本跑模型推理:九分之一现代 CPU 速度,但成功了!

软件工程师 Andrew Rossignol 成功在一台已有 20 年历史的 PowerBook G4 笔记本电脑上运行了生成式 AI 模型,展示了旧硬件与现代 AI 技术的兼容性。这台笔记...

四个维度深入剖析「 Test-Time Scaling 」!首篇系统综述,拆解推理阶段扩展的原理与实战

随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭,推理阶段扩展(Test-Time Scaling, TTS)技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...

1000万上下文!新开源多模态大模型,单个GPU就能运行

今年2月初,谷歌发布的Gemini 2.0 Pro支持200万上下文,震惊了整个大模型领域。然而,仅过了2个月,Meta最新开源的Llama 4 Scout就将上下文扩展至1000万,整...

谷歌等最新研究,合成数据可将大模型数学推理提升8倍

随着大模型如ChatGPT的快速发展,对高质量训练数据的需求呈指数级增长,预计最快将在2026年耗尽现有的300万亿tokens的公开数据集。为了解决这一问题,合成数...
1 4 5 6 7 8 54