音频生成

音频,audio

非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造

MIT初创团队Liquid AI推出了一种新型架构模型LFM(Liquid Foundation Model),在性能上超越了同等规模的Transformer模型如Llama3.2。LFM模型包含1.3B和3B两...

MIT系初创打破Transformer霸权!液体基础模型刷新SOTA,非GPT架构首次显著超越Transformer

MIT系初创公司Liquid AI推出了一种新型多模态非Transformer模型——液体基础模型LFM,该模型在基准测试中超越了现有的Transformer模型,成为新的SOTA(State of...

AI音频成诈骗神器!律师父亲险被骗走21万,3秒原声即可克隆声音

在AI技术飞速发展的今天,Deepfake技术的应用已经渗透到社会的各个角落,带来了一系列严重的安全问题。最近,国外一名律师Jay Shooster的父亲就险些成为一场A...

大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」

谷歌的实验性AI产品Notebook LM因其新功能而受到广泛关注,该功能允许用户上传各种格式的文件,AI将这些文件转换成文字要点,并提供音频概述,即AI生成的对话...

为什么Karpathy说NotebookLM中蕴藏着类似 ChatGPT 的机会?

Andrej Karpathy 在最近一次介绍中提到了谷歌的 NotebookLM,他认为这款产品可能代表着一种全新的交互形式,类似于 ChatGPT,能够开启 LLM 产品的新领域。目...

效率提升225倍!美国警察用类ChatGPT 8秒写完犯罪报告

在美国俄克拉荷马城,警察Sgt. Matt Gilmore和他的警犬Gunner在执行任务时,利用了一款名为Axon的类ChatGPT产品来生成犯罪和搜索报告。这款工具能够从执法记...

「群体智能」剑指AGI革命!国产架构挑战Transformer霸权,首款非Attention模型更新

国内AI初创团队RockAI提出了一种新的方法来实现通用人工智能(AGI),即通过“群体智能”来赋予每个设备智能,并实现类人交互。他们认为,要实现这一目标,需要...

OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头

9月25日,Google宣布了两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的发布。Gemini Pro是Google系列模型中的中等规模模型,对付费用户开放,而Gemini...

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

法国初创团队Kyutai开发的端到端语音模型Moshi已经开源,该模型以其自然聊天、情绪丰富、支持打断和非回合制对话等特点受到关注。模型参数量为7.69B,支持在p...

阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了

阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...
1 5 6 7 8 9 31