标签:大模型

从技术神话到应用落地:爆火的 DeepSeek、Manus 揭示了 AI 价值转化密码

AI 产业正迎来关键拐点,落地应用成为新的竞争焦点。近期,Manus 这款通用型 AI Agent 的爆火,彻底点燃了国内外 AI 行业的热情,标志着 AI 从技术展示向实际...

FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎

「国产大模型 + 国产引擎 + 国产芯片」的完整技术闭环正在加速形成。随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI ...

出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了

DeepSeek-R1 作为生成式 AI 技术的核心,推动了新一轮 AI 技术的爆发,其强大的自然语言处理与推理能力为开发者提供了高性能、低成本的解决方案。然而,由于...

DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1

搭载M3 Ultra芯片的Mac Studio在本地运行满血版DeepSeek R1模型的表现引发了广泛关注。M3 Ultra作为苹果最新的高性能芯片,配备了32核中央处理器、80核图形处...

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

大语言模型(LLM)在推理领域的最新进展表明,通过扩展测试时计算可以显著提升模型的推理能力。OpenAI的o1系列等模型展示了这一潜力,尤其是在生成长推理链时...

新科研神器!这回读英文论文真跟读中文没两样了

翻译软件与大模型的结合,正在推动翻译领域的深刻变革。与通用大模型相比,翻译软件在垂直领域的语料积累和系统工程方面具有独特优势。百度翻译通过多年的技...

谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍

谷歌CEO Sundar Pichai宣布开源最新多模态大模型Gemma-3,该模型主打低成本高性能,共有10亿、40亿、120亿和270亿四种参数版本。即便最大的270亿参数版本,仅...

小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化

随着大模型技术从技术变革转向产业变革,传统基础设施技术已无法满足大模型应用的快速发展需求,整个基础设施技术和产业链正在向大模型基础设施技术转型。多...

张向征:大模型安全研究与实践

随着大模型在各行业的广泛应用,其作为数智化系统的关键基础设施,带来了显著的安全风险和技术挑战。360 智脑总裁张向征在 AICon 全球人工智能开发与应用大会...

LangChain创始人激辩MCP: 这是行业新标准,还是昙花一现?

Agentic AI 作为当前行业的热点,其核心问题之一是如何让大模型有效地调用工具。目前,主流的解决方案包括 computer/browser use 和 agent 协议,后者以 Anth...
1 3 4 5 6 7 48