图像生成

图像,绘画

对抗「概念飘逸」难题!谷歌发布全新时间感知框架:图像识别准确率提升15%

新智元报道了Google AI研究人员提出的新方法MUSCATEL(Multi-Scale Temporal Learning),旨在解决机器学习中的长期问题——概念漂移。概念漂移指的是数据分布...

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

Ideogram是一款新兴的文生图工具,它在文字渲染能力上表现出色,成功获得了8000万美元的融资。这款工具能够根据用户的提示生成带有自然悬浮文字或立体文字的...

讯飞医疗不足三年亏损超4亿 赴港上市被指缓解科大讯飞财务压力

讯飞医疗向港交所提交招股书,计划发行不超过发行后总股本15%的股份,在香港联交所主板上市。讯飞医疗成立于2016年,是科大讯飞拓展智能医疗板块的主体,主要...

OpenAI推出Feather,Sora影响力继续扩大

OpenAI近期推出Feather功能,为企业用户提供数据标注和微调服务。同时,DALL-E 3模型将增加67种图像风格和设置功能,ChatGPT新增语音播报和聊天创意功能,知...

轻松让张国荣、赫本唱歌,阿里推出创新视频模型EMO

本文介绍了阿里巴巴集团AI研究院推出的创新性视频模型——EMO。该模型能够通过用户提供的图像和音频生成表情丰富的视频,如让张国荣唱歌或让赫本唱《Perfect》...

HiDream CTO 姚霆:Sora 出圈,中国 AI 创业公司的机会在哪里?

在这篇文章中,HiDream.ai 智象未来的 CTO 姚霆博士对 Sora 的技术进行了深入解读,并探讨了 AI 生成视频技术在影视级应用方面的实践。智象未来开发的「智象...

2023年,被用户放弃了的 Top AI 产品有哪些?

文章总结:这篇文章主要分析了2023年上半年AI产品榜单的变化,以及市场上AI产品的供给和用户需求的变化。文章分为六个部分:1. 20款产品掉队,ToB类榜单变动...

Gemini翻车,谷歌决策十字路口:该解雇CEO还是该进行“结构化变革”?

摘要:谷歌的Gemini Pro 1.5发布后,因无法生成“白人形象”而引发争议,被指责存在价值观上的歧视。谷歌CEO Sundar Pichai 发表声明,承诺进行结构性改变。此...

ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型

摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...
1 110 111 112 113 114 126