文章摘要
【关 键 词】 微软、大模型、WizardLM-2、GPT-4、开源
“`html
微软近期发布并迅速下架了其最新的开源大模型WizardLM-2,原因是在发布前忘记进行了关键的“毒性测试”。
WizardLM-2模型提供了三个版本:8x22B、70B和7B,旨在满足不同规模和要求。
其中,8x22B版本是旗舰模型,拥有1410亿个参数,是开源社区中最有效的模型之一。
模型发布后不久,微软开发人员在社交平台上发布声明,承认了发布过程中的疏忽,并承诺在重新发布模型之前进行必要的测试。
外界消息称,WizardLM-2的研发团队总部位于北京,他们澄清删除模型是因为忘记测试,而非绕过审查。
大语言模型的毒性指的是其生成有害或不当内容的能力,这可能会引发公众对AI技术的负面态度,甚至招来政府调查。
因此,为了避免潜在的风险,微软从GitHub和Hugging Face上移除了该模型的所有文件。
WizardLM-2是基于Meta的Llama模型微调得到的,采用混合专家(MoE)架构开发,支持模型在多个领域提供精致且与上下文相关的响应。
WizardLM-2的性能与其他大模型相比极具竞争力,其7B版本甚至与参数规模是其10倍的领先模型有相当的性能表现。
微软在AI领域的步伐加快,尤其是在与OpenAI的合作下,通过Azure云计算平台、Office生产力套件和Bing搜索引擎中嵌入人工智能,微软已成为生成式AI时代的先行者。
微软与OpenAI的合作始于2017年,到2019年,微软成为了OpenAI商业化的首选合作伙伴,并将OpenAI的大语言模型集成到Azure云服务中,推动了微软商业帝国的复兴。
尽管微软在AI领域取得了显著的进展,但其自主研发的大模型WizardLM-2的发布和下架事件表明,公司在负责任的AI实践方面仍有改进空间。
微软的市值在2024年达到了3万亿美元,超过了法国的GDP总和,显示了其在科技领域的巨大价值。
然而,微软想要依靠自身实力保持领先地位,并在激烈的竞争中始终处于有利位置,仍然面临着挑战。
“`
原文和模型
【原文链接】 阅读原文 [ 2051字 | 9分钟 ]
【原文作者】 AI前线
【摘要模型】 gpt-4
【摘要评分】 ★★★★☆