标签:模型

全球首个工业界多模态推理模型开源!38B硬刚DeepSeek-R1,训练秘籍全公开

昆仑万维近日发布了全球首个开源的多模态推理大模型Skywork R1V(简称R1V),该模型拥有38B参数,性能直逼DeepSeek-R1,并在多项基准测试中取得了领先的成绩...

华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!

在AI领域,大规模语言模型(LLMs)已经展示了强大的推理能力,但高昂的计算成本和延迟问题依然是一个重大挑战。最近,Zoom的研究团队提出了一种全新的推理范...

被DeepSeek刺激完的VC们,终于让自己忙起来了

DeepSeek对中国创投圈的冲击远比ChatGPT更为猛烈和实际。2025年初,一级市场的动向显示,随着DeepSeek需求的爆发,AI基础设施(AI Infra)公司纷纷宣布新的融...

​实测新版通义 APP:更好用的个人 AI 助理,需要什么?

通义App近期进行了重要升级,整合了最新开源的QwQ-32B大模型,并引入了人格化的智能体作为主要交互对象。与传统的AI大模型不同,智能体强调目标导向,通过感...

云计算巨头AI战略分化:谁将定义企业级AI的未来规则?

AI大模型的商业化进程正在深刻改变云计算行业的竞争格局。从2023年的技术验证阶段,到2024年的规模生产阶段,企业级客户的需求逐渐从追求单一模型的极致性能...

OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包

前沿推理模型在训练过程中表现出一种被称为“奖励欺骗”的行为,即模型通过钻系统漏洞来获取高额奖励,而不是按照设计者的预期完成任务。这种行为类似于人类在...

DeepSeek后更大的机遇:AI端侧推理创新 | 智在终端

AI推理时代需要高性能、高能效的芯片设计。高通在终端AI领域的前瞻预判和技术布局使其再次引领了时代之先。高通的定制CPU、NPU、GPU和低功耗子系统构成了其行...

Github超2万星,OpenManus核心作者聊Agent发展趋势

随着推理模型能力的提升,近期关于Agent技术的讨论热度显著上升。3月5日晚,Manus的Demo展示引发了全网关注,随后国内DeepWisdom MetaGPT团队和CAMEL AI团队...

Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

Anthropic最近发布了其最新的AI模型Claude 3.7 Sonnet,该模型在推理能力上表现出色,甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力...

狂热过后,我和几位硬件工程师聊了聊 Manus 的价值和意义

Manus AI 的推出引发了硬件行业的广泛关注,尤其是在大型行动模型(LAM)领域。LAM 是大型语言模型(LLM)的延伸,旨在成为人类在数字世界中的代理人,帮助用...
1 2 3 4 7