“多模态”的搜索结果

AI创作真正All in One的大模型产品竟然是它?
百度在2024年百度世界大会上发布了名为“自由画布”的AI创作新物种,由百度文库和百度网盘联合出品,旨在打造一个智能生产力的All in One...
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
中国生数科技推出的Vidu 1.5模型,成为全球首个支持多主体一致性的多模态视频生成模型,颠覆了传统单点微调方法,标志着视频模型统一理...
语音AI赛道全解析:市场规模超 50 亿,最有机会的场景在哪里?
Bessemer Venture Partners 的报告指出,语音 AI 在企业应用领域取得了显著进展,市场规模超过 50 亿美元。尽管传统电话客服系统效率低...
百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
百度推出了名为“自由画布”的AI创作工具,它是一个多模态大模型支持的万能白板,能够处理任何格式的素材输入,并生成用户所需的任何格式...
对话李彦宏:大模型进化变慢是好事,百度从来没对标过OpenAI
在2024年11月12日的“百度世界大会”期间,百度CEO李彦宏与行业专家进行了深入对话,探讨了人工智能的发展趋势和应用前景。李彦宏强调,尽...
应用突破还是炫技噱头:大模型能否真正驱动行业升级?
在AICon全球人工智能开发与应用大会2024北京站即将召开之际,InfoQ《极客有约》X AICon直播栏目邀请了商汤科技大模型技术总监张涛、百度...
自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥
第8届机器人学习大会(CoRL)于2024年11月6日至9日在德国慕尼黑举办,聚焦机器人学习领域的最新研究进展。会议吸引了超过1000名参与者,...
过去一年我开发 AI 视频编辑器的收获
Kirk Kaiser在离开原公司后,投身于探索大语言模型(LLM)、扩散模型等在视频领域的新应用。他曾参与打造一个独角兽级别的生成式视频编...
Vast 创始人&CEO宋亚宸:让每个人都能生成独一无二的3D模型
在硅星人首届AI创造者大会(ACC 2024)上,Vast公司创始人兼CEO宋亚宸介绍了3D生成技术的最新发展。Vast的Tripo模型能够通过文字、图片...
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
斯坦福大学李飞飞和吴佳俊团队推出了HourVideo,一个旨在评估多模态模型对长达一小时视频理解能力的基准数据集。HourVideo包含500个来自...
1 11 12 13 14 15 85