标签:大模型
智能体手机,抢跑 2026 的「方法论」
2026年春晚成为AI行业的全民曝光场,各类AI趣味玩法与红包福利深度融合,打造轻量化的“顺手一用”体验。厂商争夺的核心已从「引导用户下载App」,转向「让AI成...
DeepSeek连更GitHub,华尔街回想起被支配的恐惧:“DeepSeek第二时刻”要来了
DeepSeek工程师节后开工更新GitHub仓库的动作,瞬间牵动美国AI圈与美股市场的神经。此次更新的维护者为DeepSeekMoE等论文署名作者Huang Panpan(账号mowentia...
顶级模型Claude Sonnet 4.6与Gemini 3.1 Pro也来庆新春
春节期间,两款顶级闭源大语言模型Claude Sonnet 4.6与Gemini 3.1 Pro发布,同步展现出人工智能在电脑操作、复杂逻辑推理层面的全新进化。Claude Sonnet 4.6...
“邪修”AI芯片的Taalas,成色如何?|AGI焦点
加拿大多伦多初创公司Taalas近期推出的AI推理芯片引发行业广泛关注,该公司2023年成立,由24人核心团队耗时2年、投入3000万美元打造首款产品HC1芯片,目前累...
创新Transformer!面壁基于稀疏-线性混合架构SALA训练9B模型,端侧跑通百万上下文
面壁智能发布了行业首个大规模训练的稀疏-线性注意力混合架构SALA及其文本模型MiniCPM-SALA,该模型通过创新架构设计显著提升了长文本处理能力和推理效率。传...
9B端侧开源模型跑通百万上下文,面壁全新稀疏-线性混合注意力架构SALA立功了!
Claude Opus 4.6的发布标志着大模型进入百万级上下文时代,该模型展现出跨文档法律分析和多轮Agent规划等能力。面壁智能随后推出创新的线性与稀疏混合注意力...
千问大模型联合淘宝「悬赏」:用更好的模型,解决电商的经营难题
AI技术正深刻重塑电商行业的运营模式与竞争格局。自2023年大模型元年以来,电商领域已成为AI落地的重要试验场,从图像生成到智能客服,技术工具已显著提升行...
AI for Health:从「实验室Demo」到「国民级健康伙伴」的范式跃迁 | GAIR Live 024期预告
生成式AI在医疗健康领域的应用正经历从辅助工具向基础设施的深刻转型。医疗大模型不再局限于医学影像诊断等单一功能,而是进化为兼具全科常识与专科深度的“数...
华为发布业界首个扩散语言模型Agent,部分场景提速8倍!
大模型通往现实世界的“最后三公里”中,Agent已成为最具代表性的技术路径。当前行业共识已从单纯追求“答对问题”转向更复杂的评估维度:能否以最短路径、最少交...
逆天!Mata用13个参数26字节让模型正确率从76%飙升至91%
Meta FAIR等机构研究人员开发出一种名为TinyLoRA的极致微调技术,仅需调整13个参数(26字节)即可显著提升大语言模型的数学推理能力。该方法配合强化学习框架...





