性能优化 | 第 2 页

腾讯推出新一代快思考模型混元 Turbo S：主打秒回、低成本，将在腾讯元宝灰度上线

2月27日，腾讯混元自研快思考模型Turbo S正式发布，首字时延降低44%，吐字速度提升一倍，实现“秒回”级响应。该模型通过Hybrid-Mamba-Transformer混合架构创新...

AIGC动态

7个月前

火山引擎AI一体机DeepSeek版来了！开箱即用，小时级部署，还有大模型应用经验加持

火山引擎近期发布的AI一体机-DeepSeek版旨在帮助企业解决大模型应用落地的核心难题。该产品通过软硬件协同优化和全链路能力覆盖，支持DeepSeek R1/V3全系列模...

AI-Agent

7个月前

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

DeepSeek在开源周连续发布核心技术成果，继首日开源MLA解码核FlashMLA后，次日推出专为混合专家系统（MoE）设计的通信库DeepEP。该库针对分布式训练中专家并...

AIGC动态

7个月前

DeepSeek引发推理侧革命，火山引擎凭什么做到最优解？

DeepSeek-R1作为新一代推理模型的代表，对云计算基础设施提出了全方位挑战，推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...

AIGC动态

7个月前

“2025 年将成 Python 主导 AI 领域的最后一年”

Java作为企业级应用领域的核心语言，正通过技术革新向AI领域发起冲击。Azul公司的调查报告显示，50%的组织已使用Java构建AI功能，在以Java为中心的企业中，其...

AIGC动态

7个月前

为了让DeepSeek-R1用起来更顺畅，火山引擎将TPM上调到了500万！全网首家

DeepSeek-R1模型在火山引擎平台上的部署与应用引发广泛关注。该平台凭借字节跳动的技术支撑，提供高达500万TPM（每分钟Token数）的初始限流配额，远超阿里云...

AIGC动态

7个月前

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎，但本地部署可以提供更个性化的服...

AIGC动态

8个月前

百万tokens仅需8毛，不蒸馏造出世界一流大模型，豆包全新1.5Pro不走捷径

随着春节的临近，国内AI厂商纷纷发布新一代大模型。豆包公司在春节前推出了实时语音功能，实现了中文语音对话的断崖式领先，为用户提供了智商与情商双高的实...

AIGC动态

8个月前

CUDA护城河，有多深？

Nvidia正面临来自英特尔和AMD的新加速器的激烈竞争，这些加速器在内存容量、性能和价格方面对Nvidia的最佳芯片构成挑战。Nvidia通过其CUDA运行时在开发者社区...

AIGC动态

9个月前

重磅！OpenAI开放满血o1模型API，成本暴降60%

OpenAI在技术分享直播中发布了o1模型的API，并进行了实时API的大升级，支持WebRTC技术。o1模型API相较于预览版本，思考成本降低了60%，并新增了高级视觉功能...

AIGC动态

9个月前

标签：性能优化

腾讯推出新一代快思考模型混元 Turbo S：主打秒回、低成本，将在腾讯元宝灰度上线

火山引擎AI一体机DeepSeek版来了！开箱即用，小时级部署，还有大模型应用经验加持

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

DeepSeek引发推理侧革命，火山引擎凭什么做到最优解？

“2025 年将成 Python 主导 AI 领域的最后一年”

为了让DeepSeek-R1用起来更顺畅，火山引擎将TPM上调到了500万！全网首家

完整的671B MoE DeepSeek R1怎么塞进本地化部署？详尽教程大放送！

百万tokens仅需8毛，不蒸馏造出世界一流大模型，豆包全新1.5Pro不走捷径

CUDA护城河，有多深？

重磅！OpenAI开放满血o1模型API，成本暴降60%

热门网址

标签：性能优化

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址