音频生成
音频,audio
清华、东大等发布EMAGE,音频自动生成动作丰富的视频
研究人员联合开发了EMAGE模型,这是一种能够根据音频自动生成全身动作、面部表情和手势的创新工具。其主要功能是生成连贯且逼真的共语手势视频,适用于数字人...
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
近期,斯坦福大学教授李飞飞及其团队推出了S1模型,随后李飞飞的学生、OpenAI早期成员及前特斯拉AI总监发布了一段3小时长视频,详细介绍了AI大模型的进化历程...
美国新法案:禁止进口中国DeepSeek,违规罚1亿美元、监禁
美国参议员Josh Hawley提出的《美国AI能力与中国脱钩》法案旨在保护美国AI开发不受中国影响。法案禁止从中国进口DeepSeek等任何与AI相关的技术或知识产权,同...
Sam Altman炸场东京,亲曝GPT-5研发路线图,多模态能力颠覆传统
OpenAI联合创始人兼首席执行官Sam Altman在东京大学的活动中分享了关于GPT模型的未来发展计划。GPT-5将是一个超级混合模型,整合GPT和o系列模型,支持视频、...
2024年,半导体并购大盘点
半导体产业的并购活动在经历两年的小幅下滑后,正显示出复苏迹象。2024年初新思科技以350亿美元收购Ansys,标志着半导体企业收并购活动再次引起科技产业的强...
CES 上最火的 AI 眼镜,竟然是中国美瞳一哥做的
自2024年下半年起,AI眼镜被预测为智能硬件领域的下一个热点。Meta与雷朋合作推出的第二代Ray-Ban Meta眼镜销量过百万,引发科技巨头和眼镜厂商纷纷进入市场...
自由画布第一波实测,边玩边把DDL列表清空了
百度文库与百度网盘联合推出了一款名为“自由画布”的AI创作工具,旨在为用户提供一个全方位的创作空间,实现多模态内容创作的全流程多线程并行处理。自由画布...
实测丨年底了,我用 AI 做了一份年终总结。
百度六边形AI创作新物种——自由画布,以其强大的功能和易用性,为用户带来了全新的创作体验。自由画布能够无视文件格式,一键整合PDF、Word、音频、视频等资料...
阶跃星辰再拿多模态榜首,全方位升级发布六款模型
随着春节的临近,2025年初大模型领域迎来了新一轮的竞争高潮。OpenAI的ChatGPT推出了新功能“Tasks”,而国内厂商如月之暗面、MiniMax、生数科技等也纷纷发布了...
“自由画布”开启公测,百度文库 AI 功能月活量突破 9000 万
在1月21日的百度AI DAY活动中,百度副总裁王颖宣布,百度文库的AI功能月活跃用户(MAU)已超过9000万,日活跃用户(DAU)实现了翻倍增长。同时,百度文库与百...