标签:小模型
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
近期,小模型的研究受到关注,因为通过实用技巧,它们在性能上有望超越更大规模的模型。这种趋势的背景是大语言模型训练所需的资源变得异常昂贵,而测试时计...
ChatGPT 发布后这两年,该关注什么?机器之心打包了24个主题350多篇高质量文章
自2022年11月30日OpenAI发布ChatGPT以来,AI领域经历了翻天覆地的变化。ChatGPT经过多代迭代,获得了多模态处理和强大推理能力,而OpenAI继续引领AI发展潮流...
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
近期,人工智能领域出现了小模型的热潮。OpenAI推出了GPT-4o mini,Mistral AI与英伟达合作发布了Mistral NeMo,而苹果公司也加入了这一竞争,发布了包含70亿...
OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年
OpenAI于7月18日推出了GPT-4o mini,标志着其进入多模态小模型领域。这一举措与欧洲和中国团队在小模型领域的研究相呼应,这些团队已在此领域研究了大半年。G...
苹果在小模型上还是非常领先的
AI领域中,小模型技术越来越受欢迎,因为这些模型可以在个人设备上运行,无需依赖云端大型数据中心。苹果最近推出了OpenELM项目,包括一系列小型AI语言模型,...
刚刚!国内AI公司公布全新垂类模型,北师大教授:中国仅有150万张GPU芯片,亟待发展小模型|钛媒体AGI
3月17日下午,北京师范大学京师大模型传播应用系统发布第2期暨大模型垂类应用论坛上,上海云阙智能科技有限公司发布了一款营销垂直大模型·云阙 AI 平台产品。...
梭哈大模型的公司,给自己找了条退路
面壁智能最近发布了其旗舰端侧AI大模型MiniCPM-2B,这是一个拥有20亿参数的模型,它使用了1TB的精选数据进行训练。在多项主流评测榜单上,MiniCPM-2B的表现超...