音频生成

音频,audio

全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁

许主洪的加入标志着阿里在AI To C业务上的重要布局。作为一名IEEE Fellow和新加坡管理大学终身教授,他凭借深厚的学术积累与产业实践经验,将推动阿里的多模...

清华、东大等发布EMAGE,音频自动生成动作丰富的视频

研究人员联合开发了EMAGE模型,这是一种能够根据音频自动生成全身动作、面部表情和手势的创新工具。其主要功能是生成连贯且逼真的共语手势视频,适用于数字人...

Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现

近期,斯坦福大学教授李飞飞及其团队推出了S1模型,随后李飞飞的学生、OpenAI早期成员及前特斯拉AI总监发布了一段3小时长视频,详细介绍了AI大模型的进化历程...

美国新法案:禁止进口中国DeepSeek,违规罚1亿美元、监禁

美国参议员Josh Hawley提出的《美国AI能力与中国脱钩》法案旨在保护美国AI开发不受中国影响。法案禁止从中国进口DeepSeek等任何与AI相关的技术或知识产权,同...

Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统

OpenAI联合创始人兼首席执行官Sam Altman在东京大学的活动中分享了关于GPT模型的未来发展计划。GPT-5将是一个超级混合模型,整合GPT和o系列模型,支持视频、...

2024年,半导体并购大盘点

半导体产业的并购活动在经历两年的小幅下滑后,正显示出复苏迹象。2024年初新思科技以350亿美元收购Ansys,标志着半导体企业收并购活动再次引起科技产业的强...

CES 上最火的 AI 眼镜,竟然是中国美瞳一哥做的

自2024年下半年起,AI眼镜被预测为智能硬件领域的下一个热点。Meta与雷朋合作推出的第二代Ray-Ban Meta眼镜销量过百万,引发科技巨头和眼镜厂商纷纷进入市场...

自由画布第一波实测,边玩边把DDL列表清空了

百度文库与百度网盘联合推出了一款名为“自由画布”的AI创作工具,旨在为用户提供一个全方位的创作空间,实现多模态内容创作的全流程多线程并行处理。自由画布...

实测丨年底了,我用 AI 做了一份年终总结。

百度六边形AI创作新物种——自由画布,以其强大的功能和易用性,为用户带来了全新的创作体验。自由画布能够无视文件格式,一键整合PDF、Word、音频、视频等资料...

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

随着春节的临近,2025年初大模型领域迎来了新一轮的竞争高潮。OpenAI的ChatGPT推出了新功能“Tasks”,而国内厂商如月之暗面、MiniMax、生数科技等也纷纷发布了...
1 9 10 11 12 13 44