“算力版滴滴”发布AI云新品,PPIO董事长预测未来三年模型推理成本将下降1000倍|钛媒体AGI

AIGC动态3个月前发布 TMTPOSTAGI
803 0 0
“算力版滴滴”发布AI云新品,PPIO董事长预测未来三年模型推理成本将下降1000倍|钛媒体AGI

 

文章摘要


【关 键 词】 AI大模型算力基础设施数字经济分布式云服务算力投资

中国正经历一场由AI大模型和相关技术推动的算力基础设施建设热潮。根据国家统计局数据,截至5月底,中国已规划10余个智算中心,智能算力占比超过30%,算力机架总规模超过195万架,上架率约63%。国家数据局党组书记、局长刘烈宏在2024中国国际大数据产业博览会上透露,中国八大国家枢纽节点直接投资超过435亿元,带动投资超过2000亿元,显示出中国对算力投资的重视。

AI大模型的推理若在边端进行,通过分布式推理,可以有效降低算力成本。AMD CEO苏姿丰预测,未来AI加速计算市场规模将达4000亿美元,其中至少2000亿美元将用于AI推理计算场景。中国信息通信研究院的徐恩庆指出,2023年中国数字经济占GDP比重达42.8%,数字经济蓬勃发展,其中80%的新经济规模价值由政企单位和企业使用新一代数字化技术创造。

PPIO派欧云联合创始人、董事长兼CEO姚欣在2024分布式云计算论坛上发布了专为AI推理场景设计的Serverless产品,通过算法、系统和硬件协同创新,提供模型部署、运行优化、弹性伸缩及API服务,旨在提高效率和降低成本。姚欣预测,未来三年AI大模型推理成本可能下降1000倍以上,分布式算力将成为科技革命的重要推动力。

PPIO派欧云成立于2018年,由姚欣和首席架构师王闻宇联合创立,专注于网络和边缘侧基础设施的分布式云服务。公司提供“按需付费”的商业落地模式,姚欣将其形容为“算力版的滴滴”,整合企业侧闲置碎片化算力,承载音视频和AI推理等多种服务。PPIO派欧云的业务范畴包括边缘云和算力云业务,其算力云产品广泛应用于多个园区,提供智算服务,满足多种AI应用需求。

在融资方面,PPIO派欧云已完成三轮融资,总额超过3亿元人民币,投资者包括知名机构和科技行业人士。公司联合创始人兼CTO王闻宇还推出了支持生成式AI应用开发的Model API服务产品,采用“按需付费”模式,以低价格提升AI应用开发效率,降低企业成本。

姚欣在会后交流中表示,算力需求和使用不平衡是长期存在的问题,但未来算力构成中95%将是推理算力。他预测,未来两到三年内,大模型将走向集中化和标准化,异构推理算力硬件环境将呈现多样化。开源技术是推动中国AI发展的关键,技术创新是未来发展的关键。

在对话中,姚欣还讨论了未来算力过剩的可能性、AI算力的供需平衡、AI泡沫和过热现象、算力云产品的商业化程度以及PPIO派欧云如何应对AI算力研发的挑战。他强调,PPIO派欧云的商业模式是盈利的,公司不追求短期泡沫,而是注重长期价值创造。他还提到,PPIO派欧云与其他国内AI基础设施公司的区别在于其专注于分布式推理和全栈优化能力,以及在系统结构和分布式计算领域的深厚背景。姚欣对开源社区的支持表示感谢,并期待与更多开源模型进行深度整合。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 4040字 | 17分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...