网易CodeWave：当低代码+AIGC 进入深水区，我们如何继续发展？

707 0 0

文章摘要

【关键词】 AIGC技术、低代码平台、自然语言编程、数据飞轮、设计稿转页面

网易CodeWave团队在低代码+AIGC领域取得了显著进展，通过研发多种AI能力，如自然语言生成逻辑、设计稿转低代码、代码推荐等，成功商业交付多个项目，并荣获InfoQ“AIGC最佳技术服务商TOP10”。然而，团队也面临挑战，如低代码+AIGC效果差、准确度和功能预期难以估量、提效难以度量、AI能力与低代码割裂等问题。为此，团队重新思考自然语言编程的产品技术能力，确保核心场景的准确率，提升使用效果和体验。同时，保证AI能力可度量、可量化，确保AI生成物的可干预和可调试，避免难以维护的问题。

CodeWave通过构建数据飞轮，对AI能力进行评测，包括基础能力和服务指标。通过Benchmark测评AI能力，包括通用Benchmark和领域Benchmark，以评估AI的通用能力和业务场景表现。CodeWave AI在逻辑生成领域评测集下的正确率达到80%，服务端逻辑的完全正确率达到90%。此外，CodeWave还建立了AI提效的量化标准，计算AI功能上线前后的提效率，以评估AI带来的实际价值。

在自然语言编程方面，CodeWave采用NASL作为低代码的基础语言，通过一套基础的语言系统支撑各种Web应用的领域语言。然而，NASL与TS的设计差异导致AI生成的正确率降低。为此，CodeWave通过HumanEval Benchmark牵引产品生成数据和算法类代码能力的提升，发现并解决语言和工程层面的问题。

在设计稿转页面（D2C）方面，CodeWave采用Pipeline方式，提高识别速度、准确率和可扩展性。同时，CodeWave建立了完整的D2C BenchMark体系，包括组件识别、组件预筛选、布局转换、代码生成等，以确保效果成熟可验证可量化。此外，CodeWave还建立了设计稿标准和检查插件，提升设计稿的规范，促进D2C的识别效果。

通过工程化、数据Benchmark、模型和语言侧的优化，CodeWave将AI产品从一个噱头逐步进化成一个用户可干预、效果可度量、商业可交付的成熟产品。未来，CodeWave将在IDE操作层面提供更丰富的能力，如AI风格还原、AI生成实体、AI生成流程等。