标签:长文本处理

阿里发布Qwen2.5-Turbo,支持100万Tokens上下文!

阿里巴巴推出了Qwen2.5-Turbo版本,该版本将上下文扩展至100万tokens,大幅提升了模型的理解与生成能力。这一扩展使得Qwen2.5-Turbo能够处理10部长篇小说、15...

腾讯放大招,超Meta!史上参数最大,开源专家混合模型

腾讯公司在开源大模型领域推出了一款名为Hunyuan-Large的超大模型,该模型基于Transformer架构,拥有3890亿参数,其中激活参数为520亿,能够处理长达256K的上...

面壁小钢炮 3.0 重磅发布!“无限”长文本,性能超 Kimi

面壁智能最近宣布了其旗舰端侧模型“小刚炮”系列的升级,推出了全新的MiniCPM 3.0基座模型。这一新模型以4B参数实现了超越GPT-3.5的性能,同时量化后仅占用2GB...

ChatGPT 发布近两年,4B 的端侧模型已经能够复刻当年的水平

面壁智能公司近期发布了其最新的端侧基座模型MiniCPM 3.0,该模型在参数量仅为4B的情况下,宣称性能超越了ChatGPT-3.5 Turbo。这一进展标志着端侧AI技术的重...

成本降低90%!Claude上新Gemini同款提示词缓存,一次性记住整个代码库

Claude的API新功能——API长文本缓存,允许模型“记住”一整本书或整个代码库,避免了重复输入的需要。这项功能显著降低了处理长文本的延时,并最高可节省90%的成...

对话杨植麟:聚焦生产力,做好 Kimi 这一个产品

在AGI Playground 2024上,极客公园创始人&总裁张鹏与月之暗面Kimi创始人&CEO杨植麟进行了深入对话,分享了Kimi的发展历程、目标定位以及对长文本和多模态技...

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

研究人员近日针对大型语言模型处理长文本的能力进行了深入探讨,并提出了名为RULER的新基准测试。该测试包含四大类共13项任务,旨在评估模型的“有效上下文”长...

击穿全网底价,通义千问GPT-4级大模型直降97%!1块钱能买200万tokens

阿里巴巴旗下通义千问系列模型近日宣布大幅降价,涉及9款模型,包括商业化和开源模型。此次价格调整中,性能对标GPT-4的主力模型Qwen-Long,其API输入价格从0...

谷歌最新发布Med-Gemini多模态医学大模型,科研与临床诊疗落地的鸿沟

Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展,它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多模态微调和定制编码器...

你的超级知识助手来了!讯飞星火支持长文本长图文长语音,生产力直线UP

星火大模型能力升级:新版本支持长文本、长图文和长语音的处理,能够快速学习和响应各种来源的信息,如文本、图片、语音等,并在多个行业场景中提供专业准确...
1 2