图像生成
图像,绘画
OpenAI搜索产品曝光:AI即将颠覆搜索引擎!
OpenAI正在开发一款名为SearchGPT的搜索引擎产品,旨在挑战Google在搜索领域的霸主地位。SearchGPT不仅仅是一个搜索工具,它通过引入聊天问答形式、图像识别...
开源Open-Sora大更新:可生成16秒,720P高清视频
本文介绍了国内著名大模型开源公司潞晨科技的开源文生视频模型Open-Sora的大更新。该模型现在能够生成16秒、分辨率高达720P的视频,并具备处理任何宽高比的文...
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
元象公司发布了一款名为XVERSE-V的多模态大模型,该模型支持任意宽高比的图像输入,并在多项权威多模态评测中取得了领先效果。XVERSE-V模型全开源,允许无条...
一键生成 16 秒 1080P 视频,国产 Sora 的秘密,藏在这个清华系大模型团队中
在2024年,Sora技术因其在长视频生成领域的革命性突破而受到全球关注。Sora技术采用Diffusion加Transformer架构,克服了传统Stable Diffusion算法的扩展性问...
Sora的真实使用体验
Shy Kids团队是一家加拿大制作公司,以其创新的媒体制作方法和探讨现代生活主题的作品而闻名。他们制作了Sora短片《Air Head》,在后期制作中遇到了一些挑战...
清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律
Vidu模型的发布:「Vidu」能够一键生成长达16秒、分辨率达1080p的高清视频内容,其画面效果非常接近Sora,表现出色在多镜头语言、时间和空间一致性、遵循物理...
国产 Sora 的秘密,藏在这个清华系大模型团队中
在视频AIGC(人工智能生成内容)领域,Sora技术因其在长视频生成方面的突破性进展而备受关注。Sora采用的Diffusion加Transformer架构在生成内容的准确性和灵...
一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫
这篇文章介绍了一种虚拟试衣技术,由韩国科学技术院(KAIST)和OMNIOUS.AI共同开发,名为IDM-VTON。该技术利用一种新型扩散模型,能够高度还原服装细节,生成...
西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI
该论文在人工智能顶级期刊IEEE TPAMI上发表,对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理,并对该方向未来的研究重点进行了凝练与总结。视觉问答(V...
端侧模型 OctopusV3 发布:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?
随着人工智能技术的不断进步,我们见证了许多创新的AI模型的诞生。最近,Nexa AI团队推出了一款名为OctopusV3的端侧模型,这款模型被设计为一款手机上的超级...