DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶
Colossal-AI近期发布了开源大模型后训练工具箱,旨在帮助开发者通过低成本方式对DeepSeek V3/R1等大规模模型进行监督微调与强化学习优化。该工具箱支持高达67...
月活快追上优酷的红果短剧,能不能成为字节的下一个「抖音」?
红果短剧App在2024年展现出爆发式增长态势,其月活用户规模在12月达到1.58亿,同比增幅达551%,与优酷的差距缩小至3000万以内。根据行业预测,该App有望在202...
DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
DeepSeek V3/R1等大模型在开源社区广泛应用的背景下,如何通过后训练技术实现低成本、高质量的私有模型定制成为行业焦点。Colossal-AI推出的开源大模型后训练...
Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力
OpenAI推出并开源了全新基准测试SWE-Lancer,旨在通过真实软件工程任务评估大模型的编码能力。该基准包含来自自由职业平台Upwork的1,488个任务,总价值达100...
发论文亲自上?创业十多年,DeepSeek梁文锋的“技术男”属性从没改变
DeepSeek团队近日发布新论文,提出名为Native Sparse Attention(NSA)的新型注意力机制。该机制通过动态分层稀疏策略,结合粗粒度标记压缩与细粒度标记选择...
奥特曼押注惨败,爆火Ai Pin已死!ChatGPT版iPhone终结,惠普1.16亿美元接盘
* * *曾被视为“ChatGPT版iPhone”的AI可穿戴设备Ai Pin,在经历短暂的市场热潮后宣告失败。其开发公司Humane近日被惠普以1.16亿美元收购,交易涵盖核心AI技术...
最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型
阶跃星辰与吉利汽车集团联合宣布,将Step系列多模态大模型向全球开发者开源。此次开源包含参数量达300亿的Step-Video-T2V视频生成模型,以及产品级开源语音交...
宇树机器人跳舞被疑AI合成,王兴兴发新视频自证,小红书:还是疑似AI合成
一段展示宇树G1人形机器人灵活舞姿的视频引发广泛讨论。该视频由宇树科技CEO王兴兴在小红书平台发布,视频中特意放置的镜子成为关键证据,旨在回应此前关于机...
DeepSeek满血微调秘籍开源!站在巨人肩膀打造私有模型,一手教程在此
Colossal-AI团队近期推出开源大模型后训练工具箱,为开发者提供低成本构建私有模型的解决方案。该工具箱支持对DeepSeek-V3/R1-671B等大模型进行全流程优化,...
Elon Musk用20万个GPU打造Grok 3,目标是100万GPU
伊隆·马斯克与xAI团队近日发布新一代AI聊天机器人Grok 3,宣称其具备“地球上最聪明AI”的能力。该模型在复杂物理、高等数学及编程任务中展现出显著优势,独立...