文章摘要
月之暗面公司近期宣布其对话式AI助理产品Kimi支持200万字无损上下文输入,较去年10月发布的20万字有了显著提升。这一技术突破引起了业界和资本市场的广泛关注,九安医疗等“Kimi概念股”因此受到市场追捧。Kimi的长文本处理能力满足了信息爆炸时代的需求,用户数量迅速增长,但也给服务器带来了压力,导致服务一度异常。
月之暗面成立于2023年4月,由清华大学交叉信息学院毕业生杨植麟创立,已完成三轮融资,投资者包括红杉中国、真格基金等,最新融资超10亿美元,估值达25亿美元。尽管Kimi在长文本处理能力上取得了进展,但阿里巴巴、360公司和百度等大厂也在该领域取得了新进展,阿里巴巴的通义千问项目甚至开放了1000万字的长文本处理能力。
技术专家Jack表示,Kimi的优势在于上下文总结能力,但在快速定位具体信息方面存在不足。另一位技术专家Petter测试了Kimi的Web版和API版本,认为其生成效果中规中矩,但在国内处于第一梯队。长文本处理能力被视为大模型技术竞争的关键,因为它能提高模型处理复杂信息的能力,从而提升应用效果。
谷歌的Gemini 1.5 Pro模型创下了最长上下文窗口纪录,能处理远超Kimi的文本量。国外其他大模型也在提升上下文长度,如GPT-3.5、GPT-4、Anthropic和LongLLaMA等。长文本能力被认为将成为大模型的标配,但存在上限。
Kimi的成功引发了相关概念股的波动,多家上市公司回应了与Kimi的合作问题。掌阅科技、万兴科技和中广天择等公司表达了与月之暗面合作的意愿或正在进行合作。月之暗面表示,其开放平台对所有开发者和企业用户开放。循环智能宣布与月之暗面达成战略合作,将提供行业大模型解决方案及应用。
文章最后提到,长文本处理能力是大模型技术进步的重要方向,多家上市公司正积极探索与Kimi等AI技术的合作机会。
原文和模型
【原文链接】 阅读原文 [ 3272字 | 14分钟 ]
【原文作者】 AI前线
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★