文章摘要
【关 键 词】 AIGC技术、低代码平台、自然语言编程、数据飞轮、设计稿转页面
网易CodeWave团队在低代码+AIGC领域取得了显著进展,通过研发多种AI能力,如自然语言生成逻辑、设计稿转低代码、代码推荐等,成功商业交付多个项目,并荣获InfoQ“AIGC最佳技术服务商TOP10”。然而,团队也面临挑战,如低代码+AIGC效果差、准确度和功能预期难以估量、提效难以度量、AI能力与低代码割裂等问题。为此,团队重新思考自然语言编程的产品技术能力,确保核心场景的准确率,提升使用效果和体验。同时,保证AI能力可度量、可量化,确保AI生成物的可干预和可调试,避免难以维护的问题。
CodeWave通过构建数据飞轮,对AI能力进行评测,包括基础能力和服务指标。通过Benchmark测评AI能力,包括通用Benchmark和领域Benchmark,以评估AI的通用能力和业务场景表现。CodeWave AI在逻辑生成领域评测集下的正确率达到80%,服务端逻辑的完全正确率达到90%。此外,CodeWave还建立了AI提效的量化标准,计算AI功能上线前后的提效率,以评估AI带来的实际价值。
在自然语言编程方面,CodeWave采用NASL作为低代码的基础语言,通过一套基础的语言系统支撑各种Web应用的领域语言。然而,NASL与TS的设计差异导致AI生成的正确率降低。为此,CodeWave通过HumanEval Benchmark牵引产品生成数据和算法类代码能力的提升,发现并解决语言和工程层面的问题。
在设计稿转页面(D2C)方面,CodeWave采用Pipeline方式,提高识别速度、准确率和可扩展性。同时,CodeWave建立了完整的D2C BenchMark体系,包括组件识别、组件预筛选、布局转换、代码生成等,以确保效果成熟可验证可量化。此外,CodeWave还建立了设计稿标准和检查插件,提升设计稿的规范,促进D2C的识别效果。
通过工程化、数据Benchmark、模型和语言侧的优化,CodeWave将AI产品从一个噱头逐步进化成一个用户可干预、效果可度量、商业可交付的成熟产品。未来,CodeWave将在IDE操作层面提供更丰富的能力,如AI风格还原、AI生成实体、AI生成流程等。
原文和模型
【原文链接】 阅读原文 [ 5444字 | 22分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★