独家对话杨传辉:AI时代来临,数据库龙头OceanBase如何自我变革?|钛媒体AGI

AIGC动态10小时前发布 TMTPOSTAGI
61 0 0
独家对话杨传辉:AI时代来临,数据库龙头OceanBase如何自我变革?|钛媒体AGI

 

文章摘要


【关 键 词】 AI数据数据库技术战略

2025年,生成式AI技术如DeepSeek和GPT-4.5引发了全球新一轮的AI热潮,数据作为AI技术发展的关键要素,已成为数字时代的新型核心生产要素。根据IDC数据,2024年全球大数据IT总投资规模约为3540亿美元,预计到2028年将接近6440亿美元,五年复合增长率(CAGR)约16.8%。其中,中国的大数据IT支出规模预计在2028年达到621.7亿美元,全球占比约10%,复合增长率24.9%,位居全球第一。中国的数据产量已占全球总产量的23%。

OceanBase首席技术官杨传辉表示,AI时代的到来使得数据处理的边界进一步延伸,尤其是多模态大模型处理的无结构化数据规模显著增长。面对数据扩展性、数据规模和碎片化等挑战,OceanBase致力于打造一体化数据处理平台,以解决客户需求。OceanBase成立于2010年,是国内领先的一体化分布式数据库公司,2020年开始商业化运作,并陆续发布了自研的OceanBase4.0、4.2、4.3等版本。目前,OceanBase已助力金融、政务、运营商、零售、互联网等多个行业的2000多家客户实现关键业务系统升级。

2025年4月,OceanBase CEO杨冰宣布公司将全面进入AI时代,打造“DATA×AI”核心能力,建设AI时代的一体化数据底座。为此,OceanBase启动了人才和组织体系升级,任命CTO杨传辉担任AI战略一号位,并成立AI平台与应用部、AI引擎组等新部门。5月17日,OceanBase将举办2025开发者大会,主题与AI相关。大会前夕,钛媒体AGI与杨传辉进行了独家对话,这也是他被任命为AI战略一号位后的首次公开对话。

杨传辉强调,打造“AI时代的一体化数据底座”是OceanBase现有战略的自然延伸,源于市场需求和公司已具备的产品技术能力。AI时代下,数据规模和种类越来越复杂多样,数据库与AI的关系不是简单的DATA+AI,而应该是DATA×AI,背后是处理海量数据和不同结构数据的能力,以及将数据与模型融合的工程能力。作为一体化分布式数据库平台,OceanBase将成为AI时代下的最佳选择。

杨传辉指出,OceanBase在实现这一目标的过程中面临技术创新、生态建设等挑战,需要不断把握策略定力,确保公司未来发展。他坚信,AI时代的一体化数据底座能够满足用户需求。在技术层面,OceanBase的分布式能力和一体化架构能够解决数据规模、数据孤岛和多模态等挑战,但仍在加强扩展性和工程能力。OceanBase的4.3和4.4版本继续沿着一体化方向前进,特别是在处理无结构化数据和加强向量能力方面。

在开发者大会上,OceanBase将发布AI相关的数据库产品和能力,包括向量数据库等一体化数据底座的数据处理能力,以及RAG服务,帮助企业通过一体化将自有数据与公开数据模型相结合,获得更大的业务价值。此外,OceanBase还将展示自身应用大模型取得的成果。

杨传辉认为,尽管预训练技术的门槛越来越高,但少数几家公司仍会不断提升能力,尤其是强化学习技术的潜力巨大。对于OceanBase这样的一体化数据底座,数据量会随着AI应用量级的增加而不断增长。AI应用需求的爆发和数据种类、结构需求的增加,使得AI对数据的需求只会越来越大。

关于大模型的“幻觉”问题,杨传辉表示,虽然不能完全消除,但随着AI推理训练、强化学习等技术的发展,模型的“幻觉”会逐渐降低,语料准确率也会不断提升。尽管存在“幻觉”,但当前的AI技术已能在许多场景中应用,未来仍有巨大潜力。

OceanBase的终极目标是成为全球数据处理领域的最佳选择,专注于数据处理,帮助用户应对数据种类和规模的变化。杨传辉强调,OceanBase不想将自己局限在“关系型数据库”的舒适圈内,而是要以更开放的心态看待最新的业务场景和数据。他坚信,AI时代的一体化数据底座能够满足用户需求,OceanBase将继续在这一领域发挥重要作用。

原文和模型


【原文链接】 阅读原文 [ 3286字 | 14分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek/deepseek-v3/community
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...