标签:架构改进

最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文

Hugging Face最新推出的30亿参数模型SmolLM3,以其全面开源和卓越性能成为小模型领域的标杆。该模型支持128k长上下文处理,并在多语言任务中展现出色表现,同...