标签:模型训练
MUMU:用文本、图像引导,多模态图像生成模型
AIGC领域的专业社区专注于微软、OpenAI、百度文心一言、讯飞星火等大型语言模型(LLM)的发展和应用落地,致力于LLM的市场研究和AIGC开发者生态建设。在图像...
关于AI你最关心什么?技术专家团亲自答(含往期真人纯享版)
2022年底,OpenAI推出了大模型ChatGPT,引发了全球对大型人工智能模型的关注。2023年,谷歌、微软等全球科技巨头以及中国企业纷纷推出了自己的大模型,加速了...
AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图
随着人工智能技术的飞速发展,AI生成的人像越来越逼真,以至于人们越来越难以区分真假。最近,一款由Claude开发的新工具被用来检测AI生成的人像,通过将图像...
谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍
在AIGC领域,大语言模型(LLM)的发展和应用落地对训练数据的需求日益增长。然而,现有的数据处理流程依赖人工筛选,成本高昂且效率低下。谷歌Deepmind的研究...
OpenAI发布最新大模型安全对齐奖励方法——RBR
随着大型语言模型(LLM)如ChatGPT的普及,确保其输出安全性变得至关重要。然而,传统的基于人类反馈的强化学习(RLHF)方法存在成本高昂和潜在偏见的问题。...
「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
许多网友错误地认为13.11%比13.8%大。AI同样无法正确回答这个问题。各大LLM在类似问题上普遍表现不佳。这些错误可能与LLM在处理数值时的某些局限性有关。问题...
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
由微软和MIT等机构的研究人员提出的新训练范式,通过因果模型构建数据集,成功地提升了模型的推理能力。该研究团队训练了一个仅有67M参数的微型Transformer模...
还得是开源!潞晨Open-Sora技术路线公开,一键生成16秒720p视频,质量更高训练成本更低
潞晨Open-Sora是一个免费开源的高清视频生成工具,自3月份发布以来,受到了广泛关注。它能够生成720p的高清视频,包括人物肖像、科幻大片、动画以及具有流畅...
英伟达开源合成数据大模型:奖励模型,超过GPT-4 Turbo
全球人工智能领导者英伟达(Nvidia)于6月15日在其官网开源了一款名为Nemotron-4 340B的大模型,专为生成合成数据而设计。该模型能够快速生成医疗、金融、制...
MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」
本文介绍了MoE(混合专家)作为一种模块化的稀疏激活技术在大型模型训练中的应用。MoE通过将模型参数划分为多个专家子模块,每个输入仅激活少数相关专家,从...