音频生成
音频,audio
AI音频成诈骗神器!律师父亲险被骗走21万,3秒原声即可克隆声音
在AI技术飞速发展的今天,Deepfake技术的应用已经渗透到社会的各个角落,带来了一系列严重的安全问题。最近,国外一名律师Jay Shooster的父亲就险些成为一场A...
大神卡帕西安利爆火AI应用,称「或是下一个ChatGPT」
谷歌的实验性AI产品Notebook LM因其新功能而受到广泛关注,该功能允许用户上传各种格式的文件,AI将这些文件转换成文字要点,并提供音频概述,即AI生成的对话...
为什么Karpathy说NotebookLM中蕴藏着类似 ChatGPT 的机会?
Andrej Karpathy 在最近一次介绍中提到了谷歌的 NotebookLM,他认为这款产品可能代表着一种全新的交互形式,类似于 ChatGPT,能够开启 LLM 产品的新领域。目...
效率提升225倍!美国警察用类ChatGPT 8秒写完犯罪报告
在美国俄克拉荷马城,警察Sgt. Matt Gilmore和他的警犬Gunner在执行任务时,利用了一款名为Axon的类ChatGPT产品来生成犯罪和搜索报告。这款工具能够从执法记...
「群体智能」剑指AGI革命!国产架构挑战Transformer霸权,首款非Attention模型更新
国内AI初创团队RockAI提出了一种新的方法来实现通用人工智能(AGI),即通过“群体智能”来赋予每个设备智能,并实现类人交互。他们认为,要实现这一目标,需要...
OpenAI 突然推送推送高级语音模式「Her」,又抢了谷歌风头
9月25日,Google宣布了两款新模型Gemini-1.5-Pro-002和Gemini-1.5-Flash-002的发布。Gemini Pro是Google系列模型中的中等规模模型,对付费用户开放,而Gemini...
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开
法国初创团队Kyutai开发的端到端语音模型Moshi已经开源,该模型以其自然聊天、情绪丰富、支持打断和非回合制对话等特点受到关注。模型参数量为7.69B,支持在p...
阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了
阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...
通义千问、MiniMax、智谱、Soul都来了,就差你了!
随着GenAI技术的飞速发展,各行各业正经历着前所未有的变革。AI社交的超拟人化、创新的人机交互体验以及内容生产方式的革新,都是这一技术进步的直接体现。这...
字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等
字节跳动公司最新发布的音乐大模型Seed-Music,通过其创新的统一框架和四大核心功能,正在重新定义AI音乐创作的边界。这个系统不仅能够生成高质量的音乐,还...