350亿参数、开放权重,Transformer作者创业后推出新大模型

AIGC动态8个月前发布 almosthuman2014
1,112 0 0

模型信息


【模型公司】 OpenAI
【模型名称】 gpt-3.5-turbo-0125
【摘要评分】 ★★☆☆☆

350亿参数、开放权重,Transformer作者创业后推出新大模型
 

文章摘要


【关 键 词】 大语言模型可扩展模型检索增强生成优化transformer架构多语言生成能力

Cohere公司推出了新的大语言模型Command-R,该模型具有35B的参数量,属于可扩展模型类别,平衡了高效率和高精度,适用于大规模生产工作负载。Command-R针对检索增强生成(RAG)等长上下文任务和工具使用进行了优化,旨在与Embed和Rerank模型配合使用,提供一流的集成和出色的表现。该模型使用优化后的transformer架构,通过监督微调和偏好训练与人类偏好保持一致。Command-R具有高度准确性、低延迟、高吞吐量、更长的上下文、跨10种主要语言的功能,并在HuggingFace上提供模型权重。此外,Command-R支持多语言生成能力,更长的上下文窗口和更低的价格,通过使用工具实现自动执行任务。Cohere还将发布技术报告展示更多模型细节。

原文信息


【原文链接】 阅读原文
【阅读预估】 1574 / 7分钟
【原文作者】 机器之心
【作者简介】 专业的人工智能媒体和产业服务平台

© 版权声明

相关文章

暂无评论

暂无评论...