小模型 | 学习AIGC

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型，该模型在多个基准测试中表现优异，超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...

AIGC动态

9个月前

刚刚，谷歌用更少参数打败 Qwen 2.5-32B！新模型 Gemma 3 号称“单 GPU 模型王”，团队紧急招兵买马！

谷歌近日发布了Gemma 3，这是一组轻量级的开源AI模型，旨在减少能源消耗和成本，同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建，...

AIGC动态

9个月前

DeepSeek推出后，移动端AI风向要变

高通凭借系统级芯片设计构建了技术护城河，其异构计算架构整合了NPU、GPU与低功耗子系统，能在保持设备续航的同时处理复杂推理任务。通过AI软件栈和开发者生...

AIGC动态

10个月前

微软首个多模态Phi-4问世，56亿参数秒杀GPT-4o！LoRA华人大佬带队

微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini，标志着小型语言模型（SLM）领域的重大突破。Phi-4-multimodal作为微软首个多模态模型，集成...

AIGC动态

10个月前

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员，标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...

AIGC动态

10个月前

极客说｜微软 Phi 系列小模型和多模态小模型

本文介绍了微软在小模型（Small Language Models, SLMs）领域的研究成果，特别是Phi系列模型。随着大模型规模的扩大，训练和运行所需的计算资源日益紧张，小...

AIGC动态

11个月前

3B模型长思考后击败70B！HuggingFace逆向出o1背后技术细节并开源

近期，小模型的研究受到关注，因为通过实用技巧，它们在性能上有望超越更大规模的模型。这种趋势的背景是大语言模型训练所需的资源变得异常昂贵，而测试时计...

AIGC动态

1年前 (2024)

ChatGPT 发布后这两年，该关注什么？机器之心打包了24个主题350多篇高质量文章

自2022年11月30日OpenAI发布ChatGPT以来，AI领域经历了翻天覆地的变化。ChatGPT经过多代迭代，获得了多模态处理和强大推理能力，而OpenAI继续引领AI发展潮流...

AIGC动态

1年前 (2024)

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

近期，人工智能领域出现了小模型的热潮。OpenAI推出了GPT-4o mini，Mistral AI与英伟达合作发布了Mistral NeMo，而苹果公司也加入了这一竞争，发布了包含70亿...

AIGC动态

1年前 (2024)

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

OpenAI于7月18日推出了GPT-4o mini，标志着其进入多模态小模型领域。这一举措与欧洲和中国团队在小模型领域的研究相呼应，这些团队已在此领域研究了大半年。G...

AIGC动态

1年前 (2024)

标签：小模型

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

刚刚，谷歌用更少参数打败 Qwen 2.5-32B！新模型 Gemma 3 号称“单 GPU 模型王”，团队紧急招兵买马！

DeepSeek推出后，移动端AI风向要变

微软首个多模态Phi-4问世，56亿参数秒杀GPT-4o！LoRA华人大佬带队

微软Phi-4家族新增两位成员，5.6B多模态单任务超GPT-4o，3.8B小模型媲美千问7B

极客说｜微软 Phi 系列小模型和多模态小模型

3B模型长思考后击败70B！HuggingFace逆向出o1背后技术细节并开源

ChatGPT 发布后这两年，该关注什么？机器之心打包了24个主题350多篇高质量文章

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

热门网址

标签：小模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址