标签:性能优越

揭示Transformer重要缺陷!北大提出傅里叶分析神经网络FAN,填补周期性特征建模缺陷

北京大学计算机学院长聘教授李戈领导的团队提出了一种新型网络架构FAN(Fourier Analysis Networks),旨在解决现有基础模型如MLP和Transformer在周期性建模...

AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%

由不列颠哥伦比亚大学(UBC)等机构的研究人员提出的智能体自动化设计(ADAS)系统,展示了AI自我设计智能体的能力。ADAS通过元智能体使用搜索算法自动构建强...

英伟达Mistral AI联袂出击!120亿小模型王者强势登场,碾压Llama 3单张4090可跑

Mistral AI与英伟达合作发布了一款名为Mistral NeMo的新型人工智能小模型,拥有12B参数并支持128K上下文。这款模型在多项基准测试中超越了其他同类产品,如Ge...

马斯克烧60亿美元难题,国内大厂有解?开源MoE模算效率黑马登场,3.7B参数单挑Llama 3-70B

在当前大模型算力需求极高的背景下,浪潮信息推出了一款名为源2.0-M32的混合专家模型。该模型以32个专家的架构,总参数量达到400亿,但激活参数仅需37亿,以...