标签:云原生

如何为预训练 LLM 添加新 token?

在预训练大模型(LLM)的微调过程中,添加新的 token 是提升模型在特定领域表现的关键步骤。这一操作不仅能够帮助模型更好地理解领域特定词汇,还能提高文本...

DeepSeek引发推理侧革命,火山引擎凭什么做到最优解?

DeepSeek-R1作为新一代推理模型的代表,对云计算基础设施提出了全方位挑战,推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...

AI时代不看独角兽,看10亿Tokens日均消耗

在大模型时代,日均10亿Tokens消耗量成为中国企业AI业务跑通的基本标准,至少200家中国企业达到这一标准,覆盖多个领域。这一标准意味着企业在垂直领域找到应...

大语言模型应用开发框架 Eino 正式开源!

字节跳动内部经过半年多的使用和迭代,基于Golang的大模型应用综合开发框架Eino已在CloudWeGo正式开源。Eino框架以组件为核心,提供强大的流程编排能力,覆盖...