图像生成
图像,绘画
国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI
新智元报道了一家名为“阶跃星辰”的初创公司在2024全球开发者先锋大会上发布了三个大型模型:Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型和Step-2...
文本直接生成2分钟视频,即将开源模型StreamingT2V
文章摘要 【关 键 词】 AIGC、大语言模型、视频生成、技术创新、StreamingT2V 近年来,人工智能生成内容(AIGC)领域取得了显著进展,特别是在大...
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
上海交通大学与上海AI实验室合作提出了一种新的框架——Long-CLIP,旨在解决CLIP模型在处理长文本时的不足。CLIP模型通过对齐视觉和文本模态,具备强大的zero-s...
今年 Q1 “神仙打架”:Sora惊艳、马斯克“找茬”,微软谷歌接连翻车 |文末好礼
2024年第一季度人工智能领域重大事件摘要以下是2024年第一季度人工智能领域发生的一系列重大事件的摘要总结:GPT Store上线:1月11日,OpenAI推出了基于GPT-4...
从游戏GPU巨头到AI芯片霸主,英伟达的成功秘诀是什么?|钛度图闻
在2024年3月举行的GTC大会上,英伟达发布了基于全新Blackwell架构的GPU芯片B200,这一新一代芯片在性能推理方面相比上一代H100提升了惊人的30倍。英伟达创始...
ChatGPT和Sora其实限制了我们对大模型的想象?
近期,一份关于OpenAI部署Sora所需硬件资源的美国市场研究报告引起了广泛关注。报告指出,在峰值时期,Sora需要高达72万张英伟达H100显卡来支持,对应成本高...
大模型预测,下一个token何必是文字?
近年来,人工智能技术的发展迅猛,特别是大模型在生成技能上的进步,已经达到了令人难以置信的水平。现在,大模型不仅能生成文字、图像和视频,还能基于历史...
阿里妈妈怎么做 AI 电商?
2024年,AI电商应用落地迅速,其中阿里妈妈作为阿里商家端服务的出口,其动向备受业内关注。阿里妈妈正式发布【1+1+3】创新业务模型,基于内部自研的AI技术,...
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
文章摘要 【关 键 词】 谷歌研究、VLOGGER模型、视频生成、音频驱动、数据集MENTOR 谷歌的研究人员近期发布了一种名为VLOGGER的多模态扩散模型,...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...