标签:开源

全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

由UCLA等机构组成的研究团队在全球首次实现了在20亿参数的非监督微调模型上进行多模态推理的突破,这一成果被称为DeepSeek-R1的「啊哈时刻」。研究团队在未经...

“大模型六虎”阶跃星辰3月将开源图生视频模型|钛媒体AGI

在首届Step UP生态开放日上,阶跃星辰公布了多项技术进展与战略规划。创始人姜大昕强调,公司正通过多模态与推理能力双轮驱动,推进AGI技术路线。今年3月将开...

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...

大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?

近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...

把训练成本打下来99%!吊打GPT又“征服”OpenAI创始成员,DeepSeek“国产之光”实至名归?

中国AI初创公司DeepSeek发布了其最新人工智能模型DeepSeek-V3的首个版本,并宣布开源。该模型能够处理多种基于文本的工作负载和任务,包括编码、翻译和撰写论...

Redis之父终于回归了

Redis创始人Salvatore Sanfilippo(Antirez)在离开项目约4.44年后重返Redis,并担任Redis大使。他的回归得到了Redis Labs CEO Rowan Trollope的欢迎,Trollo...

Ai2开源OLMo 2:数据集、训练方法、权重大放送

AI研究机构Ai2最近开源了一款名为OLMo 2的大模型,这是一款全面开放的人工智能模型,不仅提供模型权重,还包括工具、数据集和训练配方等开发所需内容。OLMo 2...

发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型

Mistral AI近期推出了其多模态家族的新成员Pixtral Large,这是一个基于124B开放权重构建的超大杯基础模型,具备顶尖的图像理解能力,能够理解文档、图表和自...

英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了

英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型,该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等竞争对手。...

击败GPT-4o、仅次于o1!英伟达重磅开源超强大模型–Nemotron

全球AI领域的领导者英伟达(Nvidia)最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的强大模型,该模型在测试中超越了140多个开闭源模型,包括GPT-4o、G...
1 5 6 7 8 9 16