音频生成

音频,audio

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

法国初创团队Kyutai开发的端到端语音模型Moshi已经开源,该模型以其自然聊天、情绪丰富、支持打断和非回合制对话等特点受到关注。模型参数量为7.69B,支持在p...

阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了

阿里巴巴集团近期推出了一款名为通义万相的AI视频生成工具,该工具在阿里云栖大会上由CTO周靖人宣布正式上线。通义万相AI视频功能专为中国市场设计,能够理解...

通义千问、MiniMax、智谱、Soul都来了,就差你了!

随着GenAI技术的飞速发展,各行各业正经历着前所未有的变革。AI社交的超拟人化、创新的人机交互体验以及内容生产方式的革新,都是这一技术进步的直接体现。这...

字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等

字节跳动公司最新发布的音乐大模型Seed-Music,通过其创新的统一框架和四大核心功能,正在重新定义AI音乐创作的边界。这个系统不仅能够生成高质量的音乐,还...

任意论文一键变播客,谷歌正式发布Illuminate,它能重构研究者的学习方式吗?

谷歌推出了一款名为Illuminate的创新产品,旨在通过人工智能技术改变研究者的学习方式。Illuminate能够将学术论文转化为AI生成的音频讨论,使得用户能够以听...

芯片,前景如何?

近期,多家机构对半导体行业的未来进行了预测。2023年,PC和通信领域是芯片使用最多的行业,占半导体销售额的57%,预计销售额为5270亿美元。汽车和工业分别占...

韩国“N号房”事件因 Deep Fake 再现,受害者向中国网友求救

视频AI生成技术的发展带来了一系列社会问题,尤其是在未经同意的情况下制作和传播女性色情图像方面。韩国女性在社交媒体上揭露了深度伪造技术的滥用,引起了...

大模型应用新战场:揭秘终端侧AI竞争关键|智在终端

2024年,AI技术普惠性成为行业共识,各大企业与学术界均在探索AI应用的落地。在大模型与AIGC应用领域,安卓手机厂商与高通等公司的合作尤为引人注目。高通在C...

阿里通义上新PPT创作!PC端“效率”功能三合一,听读写一站搞定

通义千问大模型2.5最近推出了一项新功能——PPT创作,旨在帮助用户更高效地制作演示文稿。这项功能包含两种制作方式:一种是通过一句话主题生成PPT,另一种是上...

一手实测结果出炉!智谱「超大杯」模型全家桶亮相KDD,部分任务超越GPT-4o

在KDD 2024大会上,中国的大模型技术取得了显著进展。智谱AI的顾晓韬博士介绍了支持中英双语的对话机器人ChatGLM,以及智谱基础模型的重大升级——GLM-4-Plus。...
1 8 9 10 11 12 33