商汤CEO徐立:算力、模型与应用“三位一体”,催生AI 2.0的超级时刻|2024 T-EDGE
文章摘要
【关 键 词】 AI论坛、人工智能、全球化、算力布局、大模型
2024年T-EDGE创新大会暨钛媒体财经年会于12月6日至7日在北京市大兴区举行,主题为“All-in on Globalization,ALL-in on AI”,聚焦人工智能对全球各行业的影响及企业全球化增长的新趋势。商汤科技董事长兼CEO徐立博士在T-EDGE全球AI论坛上发表演讲,探讨AI 2.0的发展挑战。
徐立提出,AI的突破往往伴随着“超级时刻”的出现,如今年诺贝尔奖所示,AI作为工具助力化学领域突破,同时物理学推动AI技术发展。他强调,AI 2.0时代,全球科技企业如OpenAI、谷歌等在算力板块进行大规模布局,显示出AI技术发展速度的迅猛。尺度定律(Scaling Laws)在大语言模型等领域的验证,成为AI 2.0的理论基础。
徐立指出,AI 2.0的关键是如何衡量资源投入,通过对比LeNet-5、AlexNet和GPT-4三代模型,展示了AI发展中成本结构的巨大变化。他强调,AI 1.0与2.0的主要区别在于成本结构的变化,需要10万PFlops的算力,意味着每年需花费120亿美金构建基础设施。
面对AI 2.0的快速变化,商汤科技确立了“大装置-大模型-应用”的三位一体战略,旨在降低训练和推理成本,优化算力成本,形成行业核心壁垒。商汤AI大装置SenseCore拥有超过5.4万块GPU,总算力规模高达20000 petaFLOPS,支持超过20个千亿超大模型同时训练。
徐立认为,AI算力的核心在于模型,商汤科技致力于成为最懂算力的大模型服务商和最懂大模型的算力服务商。他预测,2025年将成为“数据中心之年”,AI基础设施建设将以更高效、更普惠的方式推动社会进步,助力人类探索未知可能性。
原文和模型
【原文链接】 阅读原文 [ 1392字 | 6分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆