音频生成
音频,audio
非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造
MIT初创团队Liquid AI推出了一种新型架构模型LFM(Liquid Foundation Model),在性能上超越了同等规模的Transformer模型如Llama3.2。LFM模型包含1.3B和3B两...
MIT系初创打破Transformer霸权!液体基础模型刷新SOTA,非GPT架构首次显著超越Transformer
MIT系初创公司Liquid AI推出了一种新型多模态非Transformer模型——液体基础模型LFM,该模型在基准测试中超越了现有的Transformer模型,成为新的SOTA(State of...
AI音频成诈骗神器!律师父亲险被骗走21万,3秒原声即可克隆声音
在AI技术飞速发展的今天,Deepfake技术的应用已经渗透到社会的各个角落,带来了一系列严重的安全问题。最近,国外一名律师Jay Shooster的父亲就险些成为一场A...
大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」
谷歌的实验性AI产品Notebook LM因其新功能而受到广泛关注,该功能允许用户上传各种格式的文件,AI将这些文件转换成文字要点,并提供音频概述,即AI生成的对话...
为什么Karpathy说NotebookLM中蕴藏着类似 ChatGPT 的机会?
Andrej Karpathy 在最近一次介绍中提到了谷歌的 NotebookLM,他认为这款产品可能代表着一种全新的交互形式,类似于 ChatGPT,能够开启 LLM 产品的新领域。目...
效率提升225倍!美国警察用类ChatGPT 8秒写完犯罪报告
在美国俄克拉荷马城,警察Sgt. Matt Gilmore和他的警犬Gunner在执行任务时,利用了一款名为Axon的类ChatGPT产品来生成犯罪和搜索报告。这款工具能够从执法记...
「群体智能」剑指AGI革命!国产架构挑战Transformer霸权,首款非Attention模型更新
国内AI初创团队RockAI提出了一种新的方法来实现通用人工智能(AGI),即通过“群体智能”来赋予每个设备智能,并实现类人交互。他们认为,要实现这一目标,需要...
OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头
9月25日,Google宣布了两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的发布。Gemini Pro是Google系列模型中的中等规模模型,对付费用户开放,而Gemini...
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
法国初创团队Kyutai开发的端到端语音模型Moshi已经开源,该模型以其自然聊天、情绪丰富、支持打断和非回合制对话等特点受到关注。模型参数量为7.69B,支持在p...
阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了
阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...