“架构”的搜索结果

OpenAI发布文生视频模型Sora:60秒一镜到底、吊打现在所有视频生成模型
在短短十几小时内,OpenAI和谷歌接连发布了引人注目的成果,引发了国内外技术圈的广泛关注。特别是OpenAI发布的首款文生视频模型——Sora...
OpenAI今天发布了Sora(文生视频)
在官方网站 https://openai.com/sora 上介绍了一个名为Sora的AI模型,能够根据文本指令创建丰富想象力的场景。Sora可以生成长达一分钟的...
Boximator:字节跳动提出可控视频合成技术
字节跳动推出了一项名为Boximator的新技术,这是一种可控制视频中主体运动轨迹的技术。Boximator结合了框体和动画的概念,支持通过框选...
被选中!GPT-4.5 小范围测试
摘要:在人工智能领域,OpenAI推出了GPT-4.5-turbo,专注于提升交互体验和响应速度。该模型相较于GPT-4在架构、性能、适用场景和更新方...
【AI视频工具】谷歌的VideoPoet,基于大型语言模型(LLM),零样本生成视频,值得期待
文章主要介绍了谷歌的AI视频生成模型VideoPoet的最新研究成果。VideoPoet是一个大型语言模型(LLM),用于零样本视频生成,能够执行多种...
超越GPT-4V: 浦语·灵笔2在13项多模态评测的领先之旅
浦语·灵笔2是一款基于书生·浦语2-7B模型研发的图文多模态大模型,具有强大的图文写作和图像理解能力。该模型在13项多模态评测中展现出卓...
Stable Code 3B:轻量级编程助手,无GPU本地运行
摘要:在最新发布的Stable Code 3B中,Stability AI推出了一款集成了多项创新技术的轻量级编程辅助模型。该模型不仅在保持轻量的同时展...
统一多模态框架GPT4Video不仅能看懂视频也能生成视频(附视频demo)
腾讯人工智能实验室与悉尼大学在十一月发布了一项最新研究,提出了一种名为GPT4Video的统一多模态框架。该框架不仅能够理解多模态内容,...
零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先
零一万物公司于1月22日发布了Yi-VL多模态语言大模型,该模型基于Yi语言模型开发,包括Yi-VL-34B和Yi-VL-6B两个版本。Yi-VL模型在英文数...
刚上线就崩了?字节版 GPTs 征战国内市场:无需编码,快速创建 AI 聊天机器人
2月1日,字节跳动旗下AI聊天机器人构建平台Coze国内版(中文名:扣子)正式上线。该平台允许用户快速创建各类聊天机器人,并将成果部署...
1 92 93 94 95 96 99