“MoE架构”的搜索结果

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹...
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布了中国最大的MoE(Mixture of Experts)开源模型XVERSE-MoE-A36B,该模型拥有255B的总参数和36B的激活参数,实现了在不显...
英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生
MLCommons发布了MLPerf Inference v4.1的最新测试结果,其中英伟达的Blackwell架构芯片在大语言模型(LLM)推理任务中表现出色,刷新了...
MiniMax 基于 Apache Doris 升级日志系统,PB 数据秒级查询响应技术实践
MiniMax公司,作为通用人工智能科技领域的领先企业,自主研发了多种模态的通用大模型,包括具有万亿参数的MoE文本大模型、语音大模型和...
微软「小而美」系列三连发!视觉小钢炮PK GPT-4o,MoE新秀力压Llama 3.1
微软发布了Phi 3.5系列的三款新模型,分别为Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,这些模型在Huggin...
昆仑万维推出全球首款 AI 短剧平台 SkyReels,「一人一剧」时代来临
昆仑万维集团推出了全球首款AI短剧平台SkyReels,标志着“一人一剧”时代的来临。SkyReels平台集剧本生成、角色定制、分镜设计、视频拍摄...
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
在最新的中文多模态大模型测评基准SuperCLUE-V中,腾讯的hunyuan-vision和上海AI Lab的InternVL2-40B分别成为闭源和开源界的领跑者,表...
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
Meta的AI科学家Thomas Scialom在Latent Space播客节目中分享了Llama 3.1的研发思路和Llama 4的更新方向。Llama 3.1的参数规模选择考虑了...
混元单日调用tokens达千亿后,腾讯大模型战略露出全貌
随着大模型行业的快速发展,评判标准已经从单一的技术层面扩展到了战略布局、落地进展和未来判断等多个维度。腾讯作为大模型行业的重要...
阶跃星辰的100天,大模型的“后发先至”
文章讨论了人工智能大模型技术的发展及其在企业中的应用,特别关注了阶跃星辰公司在这一领域的进展。海明威的名言“逐渐地,然后突然地”...
1 2 3 5