视频生成
视频,video
OpenAI员工爆料:已抢先体验GPT-5!7月上线,疑似完全多模态
关于GPT-5的讨论近期在科技界引发广泛关注,多个线索表明OpenAI可能已开始内部测试这一新一代模型。Sam Altman在X平台关注神秘人物Yacine的举动,结合OpenAI...
90%展位已售罄!边缘AI软硬件方案创新汇聚!
边缘AI技术自去年以来进入爆发式增长阶段,预计到2025年,全球边缘AI市场价值将达到250亿美元,硬件设备总量突破20亿台,芯片市场规模达730亿美元。2025年至2...
李志飞:1 个人、2 天做出 AI 时代的「飞书」,真正的 Founder Mode
出门问问创始人李志飞在「TicNote」发布会上分享了他通过AI工具开发一款专为AI组织设计的协作平台的经历。他设定了一个大胆的目标:在两天内,完全依赖AI工具...
一天 15k 星,代码生成碾压 Claude,连 Cursor 都慌了?谷歌 Gemini CLI 杀疯了
谷歌正式发布了Gemini CLI,这是其AI助手在终端环境下的一个版本,标志着三大AI实验室均已推出各自的终端智能体工具。Gemini CLI的亮点在于其非常慷慨的免费...
谷歌AI Agent刚开源!多任务智能体+MCP+谷歌搜索,狂揽9000颗星
谷歌近日在官网开源了AI Agent框架Gemini CLI,这一框架将Gemini大模型直接集成到终端中,为用户提供了强大的功能支持。Gemini CLI的最大亮点之一是其能够直...
小米小爱同学:资源受限下,实现端侧大模型的高性能推理
随着大模型能力的持续提升,端侧设备部署成为产业界的重要工程挑战。手机、车载、IoT等设备对模型体积、推理时延、功耗和更新机制提出了极高要求,使得端侧推...
哈工大发布动画多智能体,文本一键生成连贯动画
随着大规模多模态模型的兴起,AI技术在生成叙事性视频方面的应用成为研究热点。现有的方法,如MINT Video和TTT-Video,虽然在生成单个视频片段时质量有所提升...
多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品
智象未来推出的vivago2.0是一款集成了多模态AI能力的全能创作工具,由加拿大工程院院士梅涛领衔的团队开发。该工具整合了文生图、图生视频、AI播客、特效模板...
独家 | 字节跳动机器人研究一号位孔涛离职创业
字节跳动机器人团队负责人孔涛已于6月初离职,并开始筹备自己的创业项目。孔涛于2019年7月从清华大学计算机系博士毕业,加入字节跳动后成为公司内第一位研究...
将思维链(CoT)引入具身世界,哪种路径能真正打通机器人「知行合一」?
大模型处理复杂问题时,越来越倾向于生成推理链条,将问题拆解为多个环节逐步解决。支撑这一能力的核心技术是思维链(Chain of Thought, CoT),它从最初的提...