图像生成
图像,绘画
大模型预测,下一个token何必是文字?
近年来,人工智能技术的发展迅猛,特别是大模型在生成技能上的进步,已经达到了令人难以置信的水平。现在,大模型不仅能生成文字、图像和视频,还能基于历史...
阿里妈妈怎么做 AI 电商?
2024年,AI电商应用落地迅速,其中阿里妈妈作为阿里商家端服务的出口,其动向备受业内关注。阿里妈妈正式发布【1+1+3】创新业务模型,基于内部自研的AI技术,...
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
文章摘要 【关 键 词】 谷歌研究、VLOGGER模型、视频生成、音频驱动、数据集MENTOR 谷歌的研究人员近期发布了一种名为VLOGGER的多模态扩散模型,...
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题
扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...
微软亚研院新作:让大模型一口气调用数百万个API!
微软近期发布了一种新型AI生态系统——TaskMatrix.AI,该系统通过将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来,以完成数字和物理领域的多样化...
看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了
创新奇智,中国领先的「AI+制造」解决方案提供商,近日发布了奇智孔明工业大模型2.0版本(AInno-75B),并首次展示了几款大模型原生应用,包括ChatVision、Ch...
免费AI“神器”系列第十弹:“音乐版ChatGPT”Suno爆红;双足机器人百米赛跑不到25秒|钛媒体AGI
近期,人工智能领域涌现出多款创新应用,其中包括音乐生成模型Suno V3、双足机器人Cassie、设计师专属AI设计平台Creatie、全球首个引入真实物理感知的文生视...
详解Latte:去年底上线的全球首个开源文生视频DiT
上海人工智能实验室的研究团队在视频生成领域取得了重要突破,他们成功开发了名为Latte的视频DiT模型。这是全球首个开源的文生视频DiT,受到了广泛的关注和使...
今年,中国AI大模型产业发展看这些
人工智能技术的发展正在给我们创造更大的震撼。生成式AI技术从引领技术爆发的GPT-4开始,已经席卷了各个领域。在可见的未来,向我们招手的还有具身智能,机器...
面对 AI,全球手机大厂们会怎样解题?
文章主要讨论了AI技术与手机行业的结合,以及这种结合对手机厂商的影响和挑战。首先,文章提到了一加发布的新款性价比旗舰一加ACE 3V,这款手机是第一批拥抱A...