计算效率 | 学习AIGC

冲上热搜！美团大模型，靠「快」火了

随着 AI 普及，模型厂商开始关注在保证准确性的前提下，如何以最少算力解决问题并快速给出回应，相关开源模型也逐渐增多。美团新开源的 LongCat - Flash - Ch...

AI-Agent

1周前

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

全球著名开源大模型平台DeepSeek发布了其最新开源模型V3的论文，重点探讨了在不牺牲性能的前提下，如何通过硬件架构和模型设计的创新突破硬件瓶颈。随着OpenA...

AIGC动态

4个月前

GPT-4.5 发布！OpenAI 史上最大最贵也可能是最慢那个，全网都在骂大街啦

OpenAI发布了GPT-4.5模型，目前以“研究预览”形式面向Pro订阅用户（每月200美元）和API开发者开放。该模型被官方称为“迄今知识最丰富的模型”，但明确强调其并...

AIGC动态

7个月前

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

何恺明团队最近提出了一种名为「分形生成模型」的新型AI图像生成技术，该技术通过模拟自然界中的分形现象，实现了高分辨率逐像素建模，并显著提升了计算效率...

AIGC动态

7个月前

开源赛道太挤了！月之暗面开源新版Muon优化器

月之暗面近期开源了改进版优化器Muon，其计算效率较AdamW提升2倍，并在相同训练预算下显著提升模型性能。通过引入权重衰减和一致的RMS更新技术，Muon成功解决...

AIGC动态

7个月前

DeepSeek为什么采用与主流大模型不一样的MoE架构？一文搞懂什么是MoE模型

混合专家模型（MoE）通过选择性激活子模型的方式显著提升计算效率，与传统Transformer架构形成鲜明对比。MoE模型每次计算仅激活5.5%的总参数量，而Qwen、LLam...

AIGC动态

7个月前

选择/杂交/突变，DeepMind将自然选择引入LLM思维，实现心智进化

最近，DeepSeek 和 Kimi 的推理模型更新引起了广泛关注。同时，谷歌 DeepMind、加州大学圣地亚哥分校和阿尔伯塔大学的研究者发表了一篇题为《Evolving Deeper...

AIGC动态

8个月前

扩散模型也能推理时Scaling，谢赛宁团队重磅研究可能带来文生图新范式

纽约大学谢赛宁领导的团队近期研究了扩散模型在推理时的scaling效果，发现增加推理时间计算能显著提升扩散模型生成样本的质量。研究团队通过通用搜索框架系统...

AIGC动态

8个月前

「乘法变加法」！MIT清华校友全新方法优化Transformer：Addition is All You Need

近期，MIT的两位华人学者提出了一种名为L-Mul的新型乘法算法，旨在优化大规模语言模型（LLM）的能耗问题。LLM的能耗问题已经引起了联合国的关注，因为其能耗...

AIGC动态

11个月前

AI视频搜索这个方向不错，英伟达一口气投了5000万美元

Twelve Labs，一家专注于AI视频搜索的初创公司，在英伟达领投下完成了5000万美元融资。此举反映了英伟达自2023年以来对新兴AI企业的投资趋势，Twelve Labs的...

AIGC动态

1年前 (2024)

标签：计算效率

冲上热搜！美团大模型，靠「快」火了

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

GPT-4.5 发布！OpenAI 史上最大最贵也可能是最慢那个，全网都在骂大街啦

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

开源赛道太挤了！月之暗面开源新版Muon优化器

DeepSeek为什么采用与主流大模型不一样的MoE架构？一文搞懂什么是MoE模型

选择/杂交/突变，DeepMind将自然选择引入LLM思维，实现心智进化

扩散模型也能推理时Scaling，谢赛宁团队重磅研究可能带来文生图新范式

「乘法变加法」！MIT清华校友全新方法优化Transformer：Addition is All You Need

AI视频搜索这个方向不错，英伟达一口气投了5000万美元

热门网址

标签：计算效率

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址