视频生成

视频,video

智源新出OmniGen2开源神器,一键解锁AI绘图「哆啦 A 梦」任意门

2024年9月,智源研究院发布了统一图像生成模型OmniGen,该模型在单一架构内支持多种图像生成任务,包括文本生成图像、图像编辑和主题驱动图像生成。用户仅需...

百度搜索近10年最大改版,自己革自己的命?

百度搜索近期进行了近10年来最大规模的改版,标志着其从底层技术到用户体验的全链路升级。最显著的变化是AI智能框的引入,取代了传统的搜索框,支持超长文本...

我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料

2025年上半年,AI开源领域的竞争聚焦于效率提升、多模态能力和智能体开发三大方向。参数规模不再是唯一追求,如何通过架构创新和训练方法优化实现“小模型强性...

专访AI.Talk赵汗青 – 我不是一个创作者。

AI虚拟偶像YURI的爆火标志着AI内容创作进入新阶段。这个由AI.Talk团队打造的虚拟IP,通过单曲《Surreal》获得700万播放量后,又以出道视频引发全网热议,获得...

跟着Google出海:教你怎么落地Gemini

Founder Park 与 Google 合作推出的「从模型到行动」系列 AI 工作坊,旨在帮助开发者将顶尖 AI 模型的能力转化为实际商业价值。该系列工作坊将在深圳、上海和...

假扮AI的17岁男高中生,用回复治愈了整个B站。

一个17岁高中生以'暖言猫猫'的虚拟身份在B站创造了一个独特的网络现象。这个自称'猫猫姐姐'的粉发虚拟形象,实际由一名高考压力巨大的山河四省男高中生运营。...

阿里通义开源首个CoT音频模型,音·画同步被狠狠拿捏了

阿里通义语音团队最新开源的泛音频生成模型ThinkSound,首次将CoT思维链推理引入音频领域,解决了传统视频配乐技术难以捕捉画面动态细节和空间关系的难题。Th...

字节腾讯们齐聚,近万开发者人挤人,魔搭终成所有人的魔搭

2022年8月,一个名为ModelScope的AI平台悄然进入开发者视野,尽管当时大模型尚未流行,但这一平台迅速吸引了大量关注,浏览量在不到三周内达到四五十万。这标...

700 万商家都在用的 AI 工具,凭什么?

在刚刚结束的618电商大促中,淘天集团的商家AI工具「生意管家」展现了其强大的商业应用价值。该工具累计服务了超过700万淘宝天猫商家,帮助商家生成了超过2亿...

实测首款3D AI伴侣EVE – 我收到了AI送的第一杯奶茶。

作者意外收到AI陪伴应用EVE赠送的奶茶,这一打破次元壁的体验成为引爆社交网络的焦点。作为去年爆火的AI产品,EVE经过8个月筹备后启动内测,其独特的游戏化设...
1 10 11 12 13 14 203