作者信息
【原文作者】 虎嗅APP
【作者简介】 从思考,到创造
【微 信 号】 huxiu_com
文章摘要
【关 键 词】 面壁智能、MiniCPM-2B、小模型、轻量化AI、端侧AI
面壁智能最近发布了其旗舰端侧AI大模型MiniCPM-2B,这是一个拥有20亿参数的模型,它使用了1TB的精选数据进行训练。在多项主流评测榜单上,MiniCPM-2B的表现超越了一些开源模型,包括Mistral-7B,并且在英文榜单上的表现甚至超过了一些百亿参数模型,如Falcon-40B和MPT-30B。面壁智能的CEO李大海在发布会上强调了MiniCPM-2B的优势,尽管在当前大语言模型(LLM)普遍拥有千亿甚至万亿参数的背景下,20亿参数的模型被一些人视为“小模型”。
微软也在小模型领域取得了进展,其首席执行官Satya Nadella曾在达沃斯世界经济论坛期间提到,微软的Phi模型是“最好的SLM(小语言模型)”。Phi模型及其升级版Phi-2在多个任务上的表现超越了一些更大的模型。此外,微软还组建了一个新团队专注于开发对话式AI,这些模型更倾向于小规模、低算力需求。
小模型的优势在于它们的训练和推理成本较低,这使得它们更容易被集成到端侧设备上,如智能手机和PC。这种趋势被认为是AI技术更广泛应用的关键,尤其是在那些对成本和算力有严格限制的场景中。面壁智能的MiniCPM-2B就是一个例子,它在OPPO Find N3上完成了离线推理,展示了小模型在端侧设备上的潜力。
业界对小模型的兴趣日益增加,不仅是因为它们在成本和算力上的优势,还因为它们在特定应用场景中的潜力,如工业、金融和汽车等领域。小模型能够提供更加定制化和高效的解决方案,这对于那些希望利用AI技术改进操作和服务的企业来说是非常有吸引力的。
总的来说,小模型和轻量化AI的发展正在改变AI技术的应用景观,使得AI技术不再仅仅局限于需要巨大算力的云端应用,而是可以更广泛地应用于各种端侧设备,从而为AI技术的普及和应用开辟了新的道路。
原文信息
【原文链接】 阅读原文
【原文字数】 4334
【阅读时长】 15分钟