图像生成

图像,绘画

阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!

阿里巴巴集团开源了其最新研发的视觉多模态模型Qwen2-VL,这一模型在多项性能指标上超越了OpenAI的GPT-4o和Anthropic的Claude3.5-Sonnet等知名闭源模型,成为...

智谱清言上线类4o 视频通话功能,竟然还能充当 1818 黄金眼?|AI 鲜测

智谱清言app近期更新了一项创新功能——实时视频通话,这标志着国内C端用户首次能够体验到此类服务。这项功能允许用户在通话过程中随时打断,同时AI能够观察并...

a16z万字解读:新一代皮克斯即将诞生,还会「干掉」电影和游戏

技术进步正引领着内容生产和消费方式的变革。a16z预测,以Sora为代表的视频生成技术将改变影视和游戏内容的生产流程,甚至可能促成影视与游戏的融合,形成全...

全国首个上手机的AI视频通话来了!《黑神话:悟空》经文也能破译

智谱AI最新推出了一项AI视频通话功能,该功能允许AI在观看视频的同时与用户进行交流。这一创新功能已经在智谱清言App中上线,并且是全国首个正式开放的AI视频...

视频生成控制提升几十倍,新一代轻量级ControlNeXt火了,贾佳亚团队正挑战Scaling Law

ControlNeXt是一款由思谋科技创始人贾佳亚团队开发的图像和视频生成控制工具,它在生成速度、精准控制和用户友好性方面进行了全方位优化。相较于斯坦福大学研...

谷歌推世界首个AI游戏引擎,2000亿游戏产业恐颠覆!0代码生成游戏,老黄预言成真

谷歌研究者开发了世界上首个完全由AI驱动的游戏引擎GameNGen,这一技术突破预示着游戏行业的未来可能面临重大变革。GameNGen能够在单个TPU上以每秒20帧的速度...

英伟达Blackwell称霸MLPerf!推理性能暴涨30倍,新一代「AI怪兽」诞生

MLCommons发布了MLPerf Inference v4.1的最新测试结果,其中英伟达的Blackwell架构芯片在大语言模型(LLM)推理任务中表现出色,刷新了部分任务的测试纪录。M...

再融数十亿美元,OpenAI估值将超1000亿

OpenAI目前正在进行新一轮的融资洽谈,若成功,公司估值有望突破1000亿美元。本轮融资由风险投资公司Thrive Capital领投,投资额约10亿美元,微软等其他投资...

谷歌发布Imagen 3,超过SD3、DALL・E-3

谷歌DeepMind发布的Imagen 3模型在文本到图像生成领域取得了显著进步,相较于前代产品及同类产品展现出了卓越的性能。Imagen 3采用了潜空间扩散模型技术,这...

突发!OpenAI展示草莓,很快发布“GPT-5”猎户座!

OpenAI近期展示了其秘密项目“草莓”和“猎户座”,这两个项目均聚焦于大语言模型(LLM)的发展。草莓项目旨在解决复杂推理任务,特别是在数学和编程领域,同时增...
1 2 3 4 5 6 74