“开源模型”的搜索结果

单张A100全精度推理!谷歌明星开源模型Gemma 2上新9B/27B,挑战3140亿Grok-1
昨晚,谷歌正式发布了其最新的开源模型Gemma 2系列,包括Gemma 2 9B和Gemma 2 27B。这些模型旨在为全球研究和开发人员提供高效的部署工...
ACM最新论文戳破大公司「开源」谎言,GenAI时代到底如何定义「开源模型」
在AI时代,开源的定义变得模糊不清。传统软件中的开源概念,如Linux和Windows的对比,已经不再适用于AI模型。Open Source Initiative(O...
阿里云重磅发布开源模型Qwen2,性能超Llama3-70及国内众多闭源模型
阿里云更新了其技术博客,并发布了一款新的开源模型Qwen2-72B,这一模型在性能上超越了美国的Llama3-70B以及众多中国闭源大模型,如文心...
全球最强开源模型Qwen2发布,阿里云为开闭源之争画下休止符
在大型模型领域,开源与闭源之争一直是行业关注的焦点。阿里云最新发布的Qwen2系列开源模型,为这场争论带来了新的视角。Qwen2系列包含5...
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
斯坦福团队的多模态大模型Llama3-V被指与清华大学团队的面壁智能MiniCPM-Llama3-V 2.5开源模型高度相似。Llama3-V团队的两位斯坦福本科...
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
为使大型语言模型(LLM)与人类价值观和意图保持一致,学习人类反馈是关键。近期研究提出了一种简单有效的离线偏好优化算法——SimPO。Sim...
开源模型穷途末路?Stability AI欠下1亿美元,四处找钱寻求「卖身」
Stability AI,一度估值达10亿美元的独角兽公司,正面临财务危机,考虑出售公司。尽管其推出的Stable Diffusion 3模型在图像生成领域取...
“美国最该尴尬的,是今天中国开源模型们重大的贡献”
摘要:本文介绍了中国开源大模型在国际上的竞争力和影响力。文章首先提到了阿里巴巴的开源模型“通义千问”(Qwen),它在性能上全面赶超...
全球最大开源模型再刷爆纪录!4800亿参数MoE击败Llama 3、Mixtral
Snowflake的Arctic模型以其128位专家和4800亿参数的规模,成为目前最大的开源模型。该模型基于Dense-MoE架构设计,由一个10B的稠密Trans...
开源模型打败GPT-4!LLM竞技场最新战报,Cohere Command R+上线
【新智元导读】近日,LLM竞技场的最新战报显示,Cohere发布的开源模型Command R+在不到一周的时间内就超越了GPT-4,成为历史上第一个击...
1 2 3 4 26