对话彩云科技CEO袁行远:10年AI狂飙,中国大模型发展不应只有OpenAI一条路|钛媒体AGI

AI-Agent1个月前发布 TMTPOSTAGI
197 0 0
对话彩云科技CEO袁行远:10年AI狂飙,中国大模型发展不应只有OpenAI一条路|钛媒体AGI

 

文章摘要


【关 键 词】 AI竞争AI应用技术突破模型优化商业化

全球AI技术领域的竞争正从AI模型转向AI Agent模型应用层面。美国OpenAI公司发布了ChatGPT桌面版新功能,支持理解、读写VS Code、Xcode等工具以开发应用。谷歌AI大模型Gemini移动版登陆苹果App Store应用商店,DeepL推出实时文本翻译产品DeepL Voice,公司估值超20亿美元。国内AI Agent应用也在迅速发展,彩云科技发布了基于DCFormer架构的通用大模型“云锦天章”,可实现在虚构世界观的基础上,赋予小说人物编程、数学等基础能力,拥有长文扩写、缩写等能力,已开始向C端和部分中小企业端提供服务。彩云科技CEO袁行远表示,云锦天章是世界最强的小说续写通用模型,利用新的模型结构优化,用1%的资源达到了千亿模型同等效果,叠加后处理工作流到达AI的下个阶段,才能真正实现GPT-5。

彩云科技成立于2014年,是研发多款消费级应用产品的AI公司。经过多年发展,彩云科技已孵化彩云天气、彩云小译、彩云小梦三款面向C端用户的AI产品,产品间接覆盖人数超过6亿人,并通过实施付费订阅等商业模式,实现了AI技术商业化落地。彩云科技联合创始人、CEO袁行远表示,100万DAU、ROI为正是AI应用的死亡线,从而维持一家公司或一款大模型的研发迭代。彩云科技全力实现新的大模型技术研发,团队提出基于可动态组合的多头注意力(DCMHA)的DCFormer框架,替换Transformer核心组件多头注意力模块(MHA),解除MHA注意力头的查找选择回路和变换回路的固定绑定,可根据输入动态组合,从而提升模型表达能力,相比Transformer架构性能提升1.7倍-2倍。袁行远强调,DCFormer所代表的模型结构优化这条路至少能发展10倍成长,未来AI真的很有可能取代刘慈欣的《三体》写作质量。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 3495字 | 14分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...