视频生成
视频,video
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了
本文介绍了一种名为Hyper-SD的新型扩散模型蒸馏框架,由字节跳动技术团队提出,旨在解决现有扩散模型在图像生成和视频生成任务中的高计算成本问题。Hyper-SD...
Meta 眼镜支持多模态 Llama 3,实时翻译、物体识别,AI 眼镜的机会来了!
Meta官方宣布,其智能眼镜产品现已支持多模态版的Llama 3,这一功能在开源版本中尚未实现。这款眼镜具备音乐播放、语言翻译、发送语音信息等功能,能够在用户...
性能超越GPT-4 Turbo!6000亿商汤多模态大模型登场,35万元一体机能自动生成代码|钛媒体AGI
商汤科技近日发布了“日日新SenseNova”5.0多模态大模型系列,这一系列模型采用了混合专家(MoE)架构,并支持高达10T Tokens的中英文训练数据。这一技术升级使...
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
这篇文章报道了斯坦福大学团队最新的研究成果,该研究声称语言模型实际上是一个 Q 函数而不是奖励函数。他们提出了一种直接对齐方法,即在上下文多臂赌博机设...
Sam Altman 投资的这个社交应用,怎么成了硅谷的新宠
Airchat是一款新兴的社交产品,它的核心理念是“Don’t type, just talk.”(不要打字,只是说话)。这款产品在硅谷迅速获得了关注,并且受到了一些知名人士的支...
吴恩达力推,微软、谷歌、OpenAI 押注,AI Agent 会是创业新风口吗?
```htmlAI Agent 正在成为AI领域的新风口,其发展被认为将成为AI时代的重要力量。AI巨头们如微软、OpenAI和谷歌正在开发能够处理复杂任务的AI Agent,以将客...
净赚3亿,这家厦门公司靠AI美女翻身
美图公司在2023年取得了显著的财务成果,总收入达到27亿元,同比增长29.3%,归母净利润3.7亿元,同比增长233.2%。这一成绩主要得益于AI技术的推动。美图自201...
这个AI赛道,一个月内融资4笔,一大半的创始人是华人
2024年初,AI视频生成领域在资本、创业者和公众层面获得了极大关注。特别是在华人创业者中,参与度尤为显著。在2024年3月,有三家由华人创立的AI视频生成公司...
AI 音乐,会不会诞生下一个「抖音」?
AI音乐创作工具的发展正迅速改变音乐产业的面貌。近期,美国AI初创公司Suno发布了V3音乐生成模型,它能够在短时间内根据提示词生成高质量音频,被业界视为AI...
小扎自曝愿开源100亿美元模型!2025年AGI没戏,能源短缺成最大瓶颈
在最新的播客访谈中,Facebook的创始人马克·扎克伯格(小扎)表达了他对开源AI模型的支持态度,并分享了他对人工通用智能(AGI)实现的悲观预测,以及对能源...