图像生成
图像,绘画
腾讯版Sora开源!最强开源视频模型,130亿参数、物理模拟、电影级画质!
腾讯开源了名为HunyuanVideo(混元)的视频模型,这是一个拥有130亿参数的类Sora文生视频模型,是目前参数最大的开源视频模型。混元具备物理模拟、一镜到底、...
贾佳亚、徐立研究工作获 SIGGRAPH Asia 2024 时间检验奖 丨 AI 顶会直击
SIGGRAPH ASIA 2024在日本东京举行,标志着该会议第三次在东京举办。技术论文主席Michael Wimmer在会上颁发了包括最佳论文在内的多个奖项。此次会议共收到900...
3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天
李飞飞创立的World Labs宣布了首个「空间智能」模型,该模型能够通过一张图片生成一个3D世界,这一技术被视为视频游戏和电影行业的未来。这个模型不仅能够实...
马斯克起诉OpenAI:要求开源产品,36页诉状大公开!
埃隆·马斯克近期再次对OpenAI提起诉讼,指控其违反垄断法规并背离最初的非营利宗旨。诉讼状指出,OpenAI在融资过程中要求投资者不得投资竞争对手,违反了《谢...
ICLR 惊现[10,10,10,10]满分论文,ControlNet 作者新作,Github 5.8k 颗星
在ICLR 2025会议上,张吕敏的新作IC-Light论文获得了四位审稿人一致的满分评价,成为罕见的高分论文。IC-Light是一个基于扩散模型的照明编辑模型,能够通过文...
极客说|AIGC?安全的才是最好的
本文介绍了AI内容安全(AI Content Safety)的概念,即利用技术对AI生成的内容进行审核和监测,以识别和屏蔽不当、违规或有害信息。文章通过Azure的相关能力...
工作坊报名|使用 TEN Framework 与 Azure,探索你的多模态交互新场景
GPT-4o Realtime API的发布标志着语音AI领域的新突破,带来了实时音频交互、自然语音生成、多语言能力和快速响应时间等创新特性。这些技术进步为全球企业在客...
2亿美元、文生图模型最高融资,这个新晋AI独角兽到底有多强?
黑森林工作室(Black Forest Labs)在AI生图领域取得了重大突破,即将完成由a16z领投的2亿美元融资,公司估值预计将超过10亿美元,成为该领域独角兽公司之一...
智谱「贾维斯」来了,一句话实现跨app、跨设备全自动无人操作
智谱AI在AI Agent领域取得了突破性进展,推动大模型从简单的对话(Chat)向实际行动(Act)转变,为用户带来全新的人机交互体验。公司CEO张鹏强调,智谱AI的...
沈向洋对话黄仁勋:CEO可以犯错、承认脆弱,没必要独自面对失败
黄仁勋在香港科技大学的荣誉博士学位授予仪式后,与校董会主席沈向洋就AI算力、Scaling Law、AI应用等话题进行了深入对话。黄仁勋认为AI的变革性能力在于其作...