标签:开源模型
刚刚,我用DeepSeek-R1搭建了一款RAG应用
DeepSeek-R1 是一款开源推理模型,其性能与 OpenAI-o1 相当,但成本仅为后者的不到 10%。利用 DeepSeek-R1,开发了一款名为 Agentic RAG 的应用,该应用具备...
450美元训练一个「o1-preview」?UC伯克利开源32B推理模型Sky-T1,AI社区沸腾了
加州大学伯克利分校天空计算实验室的研究团队NovaSky发布了Sky-T1-32B-Preview,这是一个32B推理模型,其训练成本不到450美元,显示出高级推理能力的复制可以...
最受欢迎开源大模型,为什么是通义?
开源大模型技术的发展正在改变人工智能领域的竞争格局。在过去一年中,通义千问的血缘模型数量迅速增长至5万多个,显示出开源模型在全球范围内的广泛影响力和...
“最强开源模型”被打假,CEO下场致歉,英伟达科学家:现有测试基准已经不靠谱了
近日,一款名为Reflection的70B开源大模型因其宣称的卓越性能受到广泛关注,但随后遭遇了一系列造假指控。该模型由小型创业团队开发,声称性能超越了包括Llam...
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,特别是在全球最大的云服务提供商亚马逊AWS上,其企业客户更倾向于使用Anthropic的闭源大模型Claude。微软内部人士也透...
10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源
开源模型Llama 3.1的405B版本经过Nous Research的微调后,发布了名为Hermes 3的微调版本。Nous Research是一个小型但技术实力强大的初创公司,专注于开放模型...
苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果
苹果公司近日在开源大模型领域取得了重大进展,推出了一款7B参数的模型,其性能与Llama 3 8B相当,且一次性开源了全部训练过程和资源。这一举措受到了业界的...
速来!潞晨Open-Sora羊毛可薅,10元轻松上手视频生成
潞晨科技的Open-Sora模型作为全球首个开源类Sora模型,以其在多种视频类型上的优异表现和低成本易用性受到关注。最新开源的1.2版本能够生成最长16秒的720p高...
全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符
在大型模型领域,开源与闭源之争一直是行业关注的焦点。阿里云最新发布的Qwen2系列开源模型,为这场争论带来了新的视角。Qwen2系列包含5款模型,从0.5B到72B...
昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理
昆仑万维宣布开源其千亿稀疏大模型Skywork-MoE,此模型基于先前的Skywork-13B模型中间checkpoint扩展而成,是首个将MoE Upcycling技术应用并落地的开源千亿Mo...