视频生成

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

智谱清言近期宣布全量上线「情感语音通话」功能，为用户带来端到端的情感语音体验。该功能在响应速度、情绪感知、语音表达、多语言支持等方面实现突破，提供...

AIGC动态

11个月前

在第七届世界声博会暨2024科大讯飞全球1024开发者节上，科大讯飞董事长刘庆峰宣布了讯飞星火大模型4.0 Turbo的发布，该模型在七大核心能力上全面超越了GPT-4 ...

AIGC动态

11个月前

趣丸科技与香港中文大学（深圳）联合研发的语音大模型“MaskGCT”已在Amphion系统中开源，供全球用户使用。该模型采用掩码生成模型与语音表征解耦编码的创新范...

AIGC动态

11个月前

科大讯飞近期推出了讯飞星火4.0 Turbo，标志着其大模型的又一次重大升级。这一版本在数学、代码和特定领域长文本能力等七大核心能力上全面超越了GPT-4 Turbo...

AIGC动态

11个月前

2023年8月18日，字节跳动将其AI对话产品Grace更名为“豆包”，这一变化标志着字节跳动在AI领域的战略转型。尽管起步较晚，字节跳动迅速调整战略，由张一鸣提出“...

AIGC动态

11个月前

OpenAI最近发布了一种名为sCM的新型扩散模型方法，该方法在生成高质量图片和3D模型方面表现出色，实现了50倍的时钟加速，尤其在高分辨率任务上效果显著。sCM...

AIGC动态

11个月前

Anthropic公司开发的新版AI模型Claude 3.5 Sonnet展示了其在计算机操作和执行任务方面的能力，标志着AI技术的竞赛已经从对话和生成能力转向了执行和操作。该...

AIGC动态

11个月前

AI初创公司Anthropic推出了一项名为“计算机使用”的新功能，使大型AI模型能够理解并交互桌面应用程序，执行如模拟按键、点击按钮、鼠标手势和输入文本等操作。...

AIGC动态

11个月前

纽约大学谢赛宁团队的最新研究强调了在视觉领域生成模型中表征学习的重要性。该团队通过引入一种新的正则化方法REPA（REPresentation Alignment），显著提升...

AIGC动态

11个月前

北京智源人工智能研究院（BAAI）近日发布了全球首个原生多模态世界模型Emu3，该模型采用了自回归技术路线，参数量达到8B（80亿），能够将图像、文本和视频编...

AIGC动态

11个月前