标签:推理
真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
最近,智能体(Agent)在AI领域再次成为焦点。2025年1月,OpenAI发布了名为DeepResearch的o3模型变种,专门用于网页和文档搜索。该模型通过强化学习训练,具...
英伟达,暴跌20%
英伟达在2025年开局表现不佳,股价下跌超过20%,市值缩水近万亿美元。尽管公司第四季度收入同比增长78%,达到创纪录的393亿美元,主要得益于数据中心部门的强...
DeepSeek后更大的机遇:AI端侧推理创新 | 智在终端
AI推理时代需要高性能、高能效的芯片设计。高通在终端AI领域的前瞻预判和技术布局使其再次引领了时代之先。高通的定制CPU、NPU、GPU和低功耗子系统构成了其行...
Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用
Anthropic最近发布了其最新的AI模型Claude 3.7 Sonnet,该模型在推理能力上表现出色,甚至在某些情况下展现出令人惊讶的决策能力。为了展示其强大的推理能力...
阿里千问QwQ-32B推理模型开源,比肩671B满血DeepSeek-R1!笔记本就能跑
阿里最新发布的QwQ-32B推理模型,凭借320亿参数的表现,成功追平了当前公认的最强开源模型DeepSeek-R1(6710亿参数),并在多项基准测试中超越了o1-mini模型...
全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理
由UCLA等机构组成的研究团队在全球首次实现了在20亿参数的非监督微调模型上进行多模态推理的突破,这一成果被称为DeepSeek-R1的「啊哈时刻」。研究团队在未经...
3140参数Grok-1推理加速3.8倍,PyTorch+HuggingFace版来了
这篇文章介绍了马斯克开源的Grok-1,以及Colossal-AI团队为Grok-1提供的方便易用的Python+PyTorch+HuggingFace版本,能将推理时延加速近4倍。Colossal-AI团队...
黄仁勋对话Transformer七子:人类正见证“AI工厂”的诞生|钛媒体AGI
在英伟达GTC大会上,英伟达CEO黄仁勋主持了一场圆桌论坛,邀请了七位Transformer论文《Attention is All You Need》的作者们。 黄仁勋表示,在过去的六十年...
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
摘要:去年,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学合作发布了LLaVA(Large Language and Vision Assistant),并在10月推出了LLaVA-1.5,最近又...
讯飞星火V3.5重磅发布,开源iFlytekSpark-13B!
第一段:讯飞星火V3.5于2024年1月30日14点发布,相比V3.0,在逻辑推理、文本生成、数学答题及小样本学习能力等方面有大幅提升。第二段:讯飞星火开源大模型iF...