音频生成
音频,audio
全面突围,谷歌昨晚更新了一大波大模型产品
谷歌在 Google’s Cloud Next 2024 大会上发布了一系列 AI 相关的更新和产品,其中包括 Gemini 1.5 Pro、CodeGemma、以及首款自研 Arm 处理器 Axion。Gemini 1...
收手吧Sam Altman!外面全是GPT-4
这篇文章讨论了GPT-4模型在人工智能领域的普及和发展,以及可能面临的瓶颈。文章首先介绍了GPT-4模型的普及情况,指出全球各地都出现了类似GPT-4级别的大型模...
谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用
Gemini 1.5 Pro是谷歌最强大的模型,现在全面对外开放,免费供开发者使用。这个版本增加了音频理解功能,可以解析各种音频内容,无需提供字幕文档。Gemini 1....
谷歌重磅发布Gemini 1.5 Pro:能自动写影评,理解视频!
随着人工智能技术的不断进步,AIGC(人工智能生成内容)领域正迎来新的发展高潮。谷歌最新发布的Gemini 1.5 Pro模型,标志着大型语言模型(LLM)在多模态理解...
没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路
2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转录YouTube视频中的音...
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程
Andrej KarpathyAndrej Karpathy,一位在人工智能领域享有盛誉的大神,近期复出并带来了一项引人注目的项目:使用纯C语言实现GPT的训练,仅用1000行代码就完...
即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多
上个月,彭博社报道了苹果公司正在与谷歌进行谈判,希望将谷歌的AI系统Gemini集成到iPhone中,以增强iPhone的AI功能。这一消息引起了业界的广泛关注,因为苹...
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...
免费AI“神器”系列第11弹:苹果版ChatGPT超越GPT-4;腾讯版Sora已获3000星|钛媒体AGI
生成式人工智能(AIGC)领域最近推出了多款新应用,钛媒体AGI整理了五款免费AI“神器”,每款都在其领域内展现了创新和潜力。苹果ReALM:这是一款由苹果研究团...
Stability AI发布table Audio 2.0,可生成3分钟44.1kHz立体声音乐
Stability AI 最近推出了 Stable Audio 2.0,这是一款在 AI 音频生成领域具有划时代意义的产品。Stable Audio 2.0 在前一版本的基础上进行了显著升级,引入了...