标签:大模型
提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人
百度近日发布了两款全新的大模型——文心大模型 X1 和文心大模型 4.5,标志着其在 AI 领域的进一步突破。这两款模型不仅在功能上各有侧重,还通过技术创新和优...
提前免费!百度发布文心大模型4.5及X1,实测后我直接真香了
百度近期发布了文心大模型 4.5 和文心大模型 X1,两款模型均已在文心一言官网上线,免费向用户开放。文心大模型 4.5 是一款原生多模态基础大模型,而文心 X1 ...
破解国产芯片FP8及DeepSeek部署难题,清华团队开源“赤兔Chitu”大模型引擎
清华大学高性能计算研究所翟季冬教授团队与清程极智联合宣布开源大模型推理引擎“赤兔Chitu”,该引擎首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运...
从技术神话到应用落地:爆火的 DeepSeek、Manus 揭示了 AI 价值转化密码
AI 产业正迎来关键拐点,落地应用成为新的竞争焦点。近期,Manus 这款通用型 AI Agent 的爆火,彻底点燃了国内外 AI 行业的热情,标志着 AI 从技术展示向实际...
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
「国产大模型 + 国产引擎 + 国产芯片」的完整技术闭环正在加速形成。随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI ...
出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了
DeepSeek-R1 作为生成式 AI 技术的核心,推动了新一轮 AI 技术的爆发,其强大的自然语言处理与推理能力为开发者提供了高性能、低成本的解决方案。然而,由于...
DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
搭载M3 Ultra芯片的Mac Studio在本地运行满血版DeepSeek R1模型的表现引发了广泛关注。M3 Ultra作为苹果最新的高性能芯片,配备了32核中央处理器、80核图形处...
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
大语言模型(LLM)在推理领域的最新进展表明,通过扩展测试时计算可以显著提升模型的推理能力。OpenAI的o1系列等模型展示了这一潜力,尤其是在生成长推理链时...
新科研神器!这回读英文论文真跟读中文没两样了
翻译软件与大模型的结合,正在推动翻译领域的深刻变革。与通用大模型相比,翻译软件在垂直领域的语料积累和系统工程方面具有独特优势。百度翻译通过多年的技...
谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
谷歌CEO Sundar Pichai宣布开源最新多模态大模型Gemma-3,该模型主打低成本高性能,共有10亿、40亿、120亿和270亿四种参数版本。即便最大的270亿参数版本,仅...