大模型 | 第 26 页

我们如何引入DeepSeek R1来做领域特定语言训练的？

在网易 CodeWave 智能开发平台中，NASL（NetEase Application Specific Language）作为核心可视化编程语言，承担了多重关键作用。首先，它能够精确描述应用的...

AIGC动态

9个月前

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

谷歌团队近期宣布了一项重大突破，提出了一种全新的分布式训练方法——DiLoCo（Distributed Low-Communication），并验证了其在大型语言模型（LLM）训练中的显...

AIGC动态

9个月前

提前免费！百度连发两款模型，我们实测：能听歌看电影，还会蛐蛐人

百度近日发布了两款全新的大模型——文心大模型 X1 和文心大模型 4.5，标志着其在 AI 领域的进一步突破。这两款模型不仅在功能上各有侧重，还通过技术创新和优...

AIGC动态

9个月前

提前免费！百度发布文心大模型4.5及X1，实测后我直接真香了

百度近期发布了文心大模型 4.5 和文心大模型 X1，两款模型均已在文心一言官网上线，免费向用户开放。文心大模型 4.5 是一款原生多模态基础大模型，而文心 X1 ...

AIGC动态

9个月前

破解国产芯片FP8及DeepSeek部署难题，清华团队开源“赤兔Chitu”大模型引擎

清华大学高性能计算研究所翟季冬教授团队与清程极智联合宣布开源大模型推理引擎“赤兔Chitu”，该引擎首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运...

AIGC动态

9个月前

从技术神话到应用落地：爆火的 DeepSeek、Manus 揭示了 AI 价值转化密码

AI 产业正迎来关键拐点，落地应用成为新的竞争焦点。近期，Manus 这款通用型 AI Agent 的爆火，彻底点燃了国内外 AI 行业的热情，标志着 AI 从技术展示向实际...

AI-Agent

9个月前

FP8模型不再挑卡！DeepSeek推理成本减半速度翻番，清华团队开源「赤兔」推理引擎

「国产大模型 + 国产引擎 + 国产芯片」的完整技术闭环正在加速形成。随着 DeepSeek 引燃市场对于大模型私有化部署的热情，模型部署的效率与成本成为企业 AI ...

AIGC动态

9个月前

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

DeepSeek-R1 作为生成式 AI 技术的核心，推动了新一轮 AI 技术的爆发，其强大的自然语言处理与推理能力为开发者提供了高性能、低成本的解决方案。然而，由于...

AIGC动态

9个月前

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

搭载M3 Ultra芯片的Mac Studio在本地运行满血版DeepSeek R1模型的表现引发了广泛关注。M3 Ultra作为苹果最新的高性能芯片，配备了32核中央处理器、80核图形处...

AIGC动态

9个月前

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新进展表明，通过扩展测试时计算可以显著提升模型的推理能力。OpenAI的o1系列等模型展示了这一潜力，尤其是在生成长推理链时...

AIGC动态

9个月前

标签：大模型

我们如何引入DeepSeek R1来做领域特定语言训练的？

谷歌重磅推出全新Scaling Law，抢救Transformer！3万亿美元AI面临岔路

提前免费！百度连发两款模型，我们实测：能听歌看电影，还会蛐蛐人

提前免费！百度发布文心大模型4.5及X1，实测后我直接真香了

破解国产芯片FP8及DeepSeek部署难题，清华团队开源“赤兔Chitu”大模型引擎

从技术神话到应用落地：爆火的 DeepSeek、Manus 揭示了 AI 价值转化密码

FP8模型不再挑卡！DeepSeek推理成本减半速度翻番，清华团队开源「赤兔」推理引擎

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

热门网址

标签：大模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址