标签:小模型
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型,该模型在多个基准测试中表现优异,超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...
刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!
谷歌近日发布了Gemma 3,这是一组轻量级的开源AI模型,旨在减少能源消耗和成本,同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建,...
DeepSeek推出后,移动端AI风向要变
高通凭借系统级芯片设计构建了技术护城河,其异构计算架构整合了NPU、GPU与低功耗子系统,能在保持设备续航的同时处理复杂推理任务。通过AI软件栈和开发者生...
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...
极客说|微软 Phi 系列小模型和多模态小模型
本文介绍了微软在小模型(Small Language Models, SLMs)领域的研究成果,特别是Phi系列模型。随着大模型规模的扩大,训练和运行所需的计算资源日益紧张,小...
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
近期,小模型的研究受到关注,因为通过实用技巧,它们在性能上有望超越更大规模的模型。这种趋势的背景是大语言模型训练所需的资源变得异常昂贵,而测试时计...
ChatGPT 发布后这两年,该关注什么?机器之心打包了24个主题350多篇高质量文章
自2022年11月30日OpenAI发布ChatGPT以来,AI领域经历了翻天覆地的变化。ChatGPT经过多代迭代,获得了多模态处理和强大推理能力,而OpenAI继续引领AI发展潮流...
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
近期,人工智能领域出现了小模型的热潮。OpenAI推出了GPT-4o mini,Mistral AI与英伟达合作发布了Mistral NeMo,而苹果公司也加入了这一竞争,发布了包含70亿...
OpenAI 终于发布 GPT-4o mini,但比中国大模型晚了半年
OpenAI于7月18日推出了GPT-4o mini,标志着其进入多模态小模型领域。这一举措与欧洲和中国团队在小模型领域的研究相呼应,这些团队已在此领域研究了大半年。G...
1
2