标签:长文本处理

面壁小钢炮 3.0 重磅发布!“无限”长文本,性能超 Kimi

面壁智能最近宣布了其旗舰端侧模型“小刚炮”系列的升级,推出了全新的MiniCPM 3.0基座模型。这一新模型以4B参数实现了超越GPT-3.5的性能,同时量化后仅占用2GB...

ChatGPT 发布近两年,4B 的端侧模型已经能够复刻当年的水平

面壁智能公司近期发布了其最新的端侧基座模型MiniCPM 3.0,该模型在参数量仅为4B的情况下,宣称性能超越了ChatGPT-3.5 Turbo。这一进展标志着端侧AI技术的重...

成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库

Claude的API新功能——API长文本缓存,允许模型“记住”一整本书或整个代码库,避免了重复输入的需要。这项功能显著降低了处理长文本的延时,并最高可节省90%的成...

对话杨植麟:聚焦生产力,做好 Kimi 这一个产品

在AGI Playground 2024上,极客公园创始人&总裁张鹏与月之暗面Kimi创始人&CEO杨植麟进行了深入对话,分享了Kimi的发展历程、目标定位以及对长文本和多模态技...

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

研究人员近日针对大型语言模型处理长文本的能力进行了深入探讨,并提出了名为RULER的新基准测试。该测试包含四大类共13项任务,旨在评估模型的“有效上下文”长...

击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens

阿里巴巴旗下通义千问系列模型近日宣布大幅降价,涉及9款模型,包括商业化和开源模型。此次价格调整中,性能对标GPT-4的主力模型Qwen-Long,其API输入价格从0...

谷歌最新发布Med-Gemini多模态医学大模型,科研与临床诊疗落地的鸿沟

Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展,它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多模态微调和定制编码器...

你的超级知识助手来了!讯飞星火支持长文本长图文长语音,生产力直线UP

星火大模型能力升级:新版本支持长文本、长图文和长语音的处理,能够快速学习和响应各种来源的信息,如文本、图片、语音等,并在多个行业场景中提供专业准确...

MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评

摘要:MiniMax,一家中国领先的通用人工智能创业公司,最近推出了一款名为'海螺AI'的生产力产品,该产品基于其自研的万亿参数大模型abab 6.5。abab 6.5在知识...

长窗口大战要终结了?谷歌魔改Transformer,推出了“无限注意力”

近期,长文本处理技术在人工智能领域取得了显著进展。谷歌推出了大模型Gemini 1.5,能够处理百万token的长文本。紧随其后,中国推出了Kimi智能助手,支持200...
1 2