音频生成
音频,audio
重磅!Llama-3,最强开源大模型正式发布!
4月19日,Meta在官网发布了开源大模型Llama-3,包括80亿和700亿两种参数版本,分为基础预训练和指令微调两种模型。相比Llama-2,Llama-3使用了15T tokens的训...
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
昆仑万维近日发布了全球最大规模的开源MOE大模型「天工3.0」,并基于此打造了国内首个公开可用的AI音乐生成大模型「天工SkyMusic」。这款音乐大模型在多个性...
首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风
昆仑万维在其大模型“天工”的一周年之际,宣布了“天工 3.0”基座大模型和“天工 SkyMusic”音乐大模型的公测。这一进展标志着人工智能在音乐创作领域的又一重要里...
中国AIGC最值得关注企业&产品榜单揭晓!首份应用全景图谱发布
市场规模与增长预测中国AIGC应用市场正在迅速扩张,预计2024年市场规模将达到200亿人民币,而到2030年,市场规模有望达到万亿级别。这一增长得益于AIGC技术的...
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍
2023年,人工智能技术的发展速度达到了前所未有的水平,斯坦福HAI研究所发布的第七个年度AI Index报告为我们提供了一个全面的行业现状概览。报告强调了大型语...
DeepMind前员工创立的AI公司发布新模型,能理解音频与视频,推理性能超过Gemini
Reka是一家总部位于旧金山的AI初创公司,由来自DeepMind、Google和Meta的研究人员联合创立,最近推出了一款名为Reka Core的全新多模态语言模型。这款模型被誉...
人在B站,要被AI公司们挤爆了
随着人工智能技术的快速发展,AI大模型公司们已经将营销战场转移到了社交媒体平台,尤其是以年轻用户为主的B站。这些公司通过各种创新的广告投放方式,如视频...
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
自2023年11月首次亮相以来,马斯克的公司在大模型领域不断取得进步,推出了,这是一个多模态模型,能够理解文本并处理文档、图表、截图和照片中的内容。Grok-...
谷歌、OpenAI、Mistral 在24小时内打响科技界“三强争霸赛”
本周,谷歌、OpenAI和Mistral在人工智能领域展开了激烈的竞争。谷歌发布了Gemini 1.5 Pro的公开预览版,这是功能最强大的生成式AI模型之一,能够处理更大的上...
音乐版Sora!文生超逼真歌曲,可自定义歌词、时间延长
4月11日,前谷歌Deepmind研究人员开发的文生音乐产品Udio全面免费开放测试。根据'AIGC开放社区'的实际使用体验,Udio在音乐质量、混音、情感表达、留白、通透...