“MoE架构”的搜索结果

文章介绍了面壁智能发布了四个特性鲜明的模型，并宣布了数亿元的新融资。这次融资由春华创投、华为哈勃领投，北京市人工智能产业投资基...

AI-Agent

7个月前

面壁智能，一家源自清华大学的创业公司，近期在大语言模型领域取得了显著进展。该公司致力于优化语言模型，以提高效率并降低成本。今年2...

AIGC动态

7个月前

国内首个音乐ChatGPT，「天工SkyMusic」，已经开启内测，引起了编辑部的极大关注。这款AI音乐生成大模型以其高质量的音乐品质和逼真的人...

AIGC动态

7个月前

最近，AI代码生成领域迎来了一位资深玩家——aiXcoder，它推出了一款专门适用于企业软件开发场景的代码大模型——aiXcoder-7B Base版。这个...

AIGC动态

7个月前

搞AI的是真没钱了

近日，一个由MIT、普林斯顿等研究机构的华人团队发布了自己的大模型JetMoE，声称仅需10万美元的成本就能训练出与数十亿美元成本的LLaMA2...

AIGC动态

7个月前

浪潮云近期在青岛发布了其海若大模型业务战略，这一战略不仅展示了过去一年中海若大模型的成功案例和技术迭代，还阐述了未来的发展规划...

AIGC动态

7个月前

腾讯在最近的财报发布后的交流会上透露，其混元模型已经是一个万亿级别参数的MOE架构模型，其中文表现在全球大语言模型中处于领先水平。...

AI-Agent

8个月前

Databricks，一家著名的数据和AI平台，于3月28日正式开源了其大模型DBRX。DBRX是一个专家混合模型（MoE），拥有1320亿参数，能生成文本/...

AIGC动态

8个月前

Databricks公司发布了全球最强开源模型DBRX，超越了Llama 2、Mixtral和Grok-1。DBRX采用了细粒度MoE架构，每次输入仅使用360亿参数，实...

AIGC动态

8个月前

在2024年3月23日的全球开发者先锋大会上，初创公司阶跃星辰发布了Step系列通用大模型，包括Step-1千亿参数语言大模型、Step-1V千亿参数...

AIGC动态

8个月前