标签:模型发布
马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B
在当前大模型算力需求极高的背景下,浪潮信息推出了一款名为源2.0-M32的混合专家模型。该模型以32个专家的架构,总参数量达到400亿,但激活参数仅需37亿,以...
Anthropic发布Claude 3模型,性能超过GPT-4
Anthropic,一家由OpenAI前高管创立的AI初创公司,最近宣布推出了Claude 3模型系列,这一系列包括三个模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus...
重磅!第二代Qwen大模型开源,阿里巴巴一口气开源了30个模型,其中Qwen1.5-72B在MT-Bench评分仅次于GPT-4
以下是加粗后的文本:阿里巴巴开源了一系列名为Qwen的大语言模型,并在2023年8月首次公开了一个拥有70亿参数的版本。在接下来的几个月里,该公司陆续发布了四...