文章摘要
【关 键 词】 AI创造者、硅基流动、Token流动、算力通缩、国产芯片
在硅星人首届AI创造者大会(ACC 2024)上,硅星人内容中心负责人王兆洋与硅基流动创始人&CEO袁进辉和清程极智CEO汤雄超就“AI Infra”和“让Token更聪明地流动”进行了深入对话。袁进辉分享了硅基流动的使命,即通过推理加速优化,降低开发者使用模型的门槛,提供类似“蛋糕机”的服务,让用户无需从头准备材料即可享用成品。汤雄超则从技术角度解释了Token流动,强调减少不必要的计算和传输,提高必要的计算和传输效率。
袁进辉认为,AI Infra的商业化是服务于商业目标的,技术只是产品中的一个要素。他强调了工程工作的耐心和积累,认为这可以成为公司的商业壁垒。汤雄超则从系统工作的角度出发,认为将构想落地的能力最为关键。两位嘉宾都认为,尽管AI Infra领域存在辛苦的工程问题,但这些正是构建商业壁垒的关键。
在讨论国产芯片的情况时,汤雄超提到,他们的系统软件设计注重可扩展性和复用性,以便快速适配新推出的芯片。他还提到,国产芯片厂商和智算中心拥有者的主要诉求是有效利用算力,而个人开发者或大模型公司则关注加速和降低算力成本。
关于算力通缩的问题,袁进辉认为这是阶段性波动,由于训练需求的减少和推理需求尚未完全消化,以及硬件升级换代的影响。汤雄超补充说,算力短缺情况在不同场景下有所不同,大集群的算力仍然紧缺。
最后,两位嘉宾分享了英伟达给他们的启发,袁进辉强调了英伟达对行业长期判断的重要性和聚焦生态建设,而汤雄超则提到了英伟达在确定性方向上的坚持和迭代过程。两位嘉宾的分享为行业提供了宝贵的见解和讨论。
原文和模型
【原文链接】 阅读原文 [ 8167字 | 33分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★