长文本处理 | 学习AIGC

月之暗面Kimi的技术一点都不落后。

月之暗面团队于2023年5月启动MoBA框架研发，旨在提升大语言模型处理长文本的效率与兼容性。该框架结合稀疏注意力与分布式训练技术，支持上下文长度扩展至10M...

AIGC动态

6个月前

阿里发布Qwen2.5-Turbo，支持100万Tokens上下文！

阿里巴巴推出了Qwen2.5-Turbo版本，该版本将上下文扩展至100万tokens，大幅提升了模型的理解与生成能力。这一扩展使得Qwen2.5-Turbo能够处理10部长篇小说、15...

AIGC动态

9个月前

腾讯放大招，超Meta！史上参数最大，开源专家混合模型

腾讯公司在开源大模型领域推出了一款名为Hunyuan-Large的超大模型，该模型基于Transformer架构，拥有3890亿参数，其中激活参数为520亿，能够处理长达256K的上...

AIGC动态

10个月前

面壁小钢炮 3.0 重磅发布！“无限”长文本，性能超 Kimi

面壁智能最近宣布了其旗舰端侧模型“小刚炮”系列的升级，推出了全新的MiniCPM 3.0基座模型。这一新模型以4B参数实现了超越GPT-3.5的性能，同时量化后仅占用2GB...

AI-Agent

12个月前

ChatGPT 发布近两年，4B 的端侧模型已经能够复刻当年的水平

面壁智能公司近期发布了其最新的端侧基座模型MiniCPM 3.0，该模型在参数量仅为4B的情况下，宣称性能超越了ChatGPT-3.5 Turbo。这一进展标志着端侧AI技术的重...

AIGC动态

12个月前

成本降低90%！Claude上新Gemini同款提示词缓存，一次性记住整个代码库

Claude的API新功能——API长文本缓存，允许模型“记住”一整本书或整个代码库，避免了重复输入的需要。这项功能显著降低了处理长文本的延时，并最高可节省90%的成...

AIGC动态

1年前 (2024)

对话杨植麟：聚焦生产力，做好 Kimi 这一个产品

在AGI Playground 2024上，极客公园创始人&总裁张鹏与月之暗面Kimi创始人&CEO杨植麟进行了深入对话，分享了Kimi的发展历程、目标定位以及对长文本和多模态技...

AIGC动态

1年前 (2024)

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

研究人员近日针对大型语言模型处理长文本的能力进行了深入探讨，并提出了名为RULER的新基准测试。该测试包含四大类共13项任务，旨在评估模型的“有效上下文”长...

AIGC动态

1年前 (2024)

击穿全网底价，通义千问GPT-4级大模型直降97%！1块钱能买200万tokens

阿里巴巴旗下通义千问系列模型近日宣布大幅降价，涉及9款模型，包括商业化和开源模型。此次价格调整中，性能对标GPT-4的主力模型Qwen-Long，其API输入价格从0...

AIGC动态

1年前 (2024)

谷歌最新发布Med-Gemini多模态医学大模型，科研与临床诊疗落地的鸿沟

Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展，它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多模态微调和定制编码器...

AIGC动态

1年前 (2024)

标签：长文本处理

月之暗面Kimi的技术一点都不落后。

阿里发布Qwen2.5-Turbo，支持100万Tokens上下文！

腾讯放大招，超Meta！史上参数最大，开源专家混合模型

面壁小钢炮 3.0 重磅发布！“无限”长文本，性能超 Kimi

ChatGPT 发布近两年，4B 的端侧模型已经能够复刻当年的水平

成本降低90%！Claude上新Gemini同款提示词缓存，一次性记住整个代码库

对话杨植麟：聚焦生产力，做好 Kimi 这一个产品

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

击穿全网底价，通义千问GPT-4级大模型直降97%！1块钱能买200万tokens

谷歌最新发布Med-Gemini多模态医学大模型，科研与临床诊疗落地的鸿沟

热门网址

标签：长文本处理

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址