标签:开源

大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?

近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...

把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?

中国AI初创公司DeepSeek发布了其最新人工智能模型DeepSeek-V3的首个版本,并宣布开源。该模型能够处理多种基于文本的工作负载和任务,包括编码、翻译和撰写论...

Redis之父终于回归了

Redis创始人Salvatore Sanfilippo(Antirez)在离开项目约4.44年后重返Redis,并担任Redis大使。他的回归得到了Redis Labs CEO Rowan Trollope的欢迎,Trollo...

Ai2开源OLMo 2:数据集、训练方法、权重大放送

AI研究机构Ai2最近开源了一款名为OLMo 2的大模型,这是一款全面开放的人工智能模型,不仅提供模型权重,还包括工具、数据集和训练配方等开发所需内容。OLMo 2...

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

Mistral AI近期推出了其多模态家族的新成员Pixtral Large,这是一个基于124B开放权重构建的超大杯基础模型,具备顶尖的图像理解能力,能够理解文档、图表和自...

英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了

英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型,该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等竞争对手。...

击败GPT-4o、仅次于o1!英伟达重磅开源超强大模型–Nemotron

全球AI领域的领导者英伟达(Nvidia)最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的强大模型,该模型在测试中超越了140多个开闭源模型,包括GPT-4o、G...

GitHub 联合创始人独家揭秘:规模小又没钱,我们凭什么能打败谷歌

Scott Chacon,GitHub的联合创始人之一,分享了他对于GitHub如何从众多代码托管平台中脱颖而出并占据主导地位的见解。他认为GitHub的成功可以归结为两个关键...

Meta开源多模态模型——Llama 3.2

Meta公司最近发布了其首个多模态大语言模型(LLM)Llama-3.2,标志着Llama系列的重大升级。此次升级包括四个不同规模的模型,旨在满足不同应用场景的需求。Ll...

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

法国初创团队Kyutai开发的端到端语音模型Moshi已经开源,该模型以其自然聊天、情绪丰富、支持打断和非回合制对话等特点受到关注。模型参数量为7.69B,支持在p...
1 2 3 9