大模型行业,根本没有什么“真”开源?

AIGC动态5个月前发布 Si-Planet
671 0 0
大模型行业,根本没有什么“真”开源?

 

文章摘要


【关 键 词】 开源大模型技术进步AI系统开源理念行业竞争

最近,开源大模型市场活跃,苹果、Meta等公司相继开源了自家的大模型。然而,开源与闭源之间的争论并未停歇。Meta认为开源引领新时代,而Sam Altman将开源闭源上升到国家和意识形态层面。李彦宏认为开源是智商税,傅盛则反驳称开源大模型免费,反而是付费闭源模型才是智商税。

开源和闭源的概念源自软件领域。开源软件公开源代码,鼓励共享和协作;闭源软件不公开源代码,由开发者控制。开源推动技术进步,闭源可能更稳定专注,但需付费且问题解决依赖开发商。

开源大模型与软件开源理念相似,但实现和需求有区别。软件开源资源需求低,大模型开源需大量计算和数据,使用限制多。业界对开源大模型无明确共识,全流程开源包括数据、设计、训练到部署的公开透明。

荷兰学者发现,许多标榜开源的模型仅开放权重,其他方面不透明。如Meta和微软的模型开放权重,但底层技术未公开。相反,资源较少的AI企业和机构表现更佳。评估显示,非营利组织开发的模型更开放。

Meta的LLaMA 3和Mistral Large 2虽开源权重,但未公开完整代码和数据。谷歌表示,开源概念不总能直接应用于AI系统。欧盟人工智能法案实施后,开源定义将更重要。

研究人员认为,创新需调整模型,需足够信息构建版本,模型也需审查。开源替代方案使关键研究成为可能,避免对闭源模型的依赖。

国内开源大语言模型统计显示,研究机构主导的模型更开放,商业公司通过开源策略获竞争优势。开源降低了开发门槛,推动创新和行业发展,促进技术成熟和应用。教育和科研也受益于开源模型。

开源大模型非简单二元特性,基于Transformer的系统复杂,难以简单归类。开源是细致工作,非所有模型需开源,也不宜道德绑架要求全面开源。多元化贡献方式构建丰富技术生态。

开源和闭源大模型共存,推动AI技术进步,满足不同需求。用户和市场会作出选择。开源促进技术传播和创新,闭源推动行业标准提升,良性竞争激发持续改进动力,为用户提供多样化选择。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 2785字 | 12分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...