2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷
文章摘要
【关 键 词】 视频生成、图像理解、多模态、AIGC技术、融资进展
智象未来(HiDream.ai)是一家专注于视频和图像生成模型的公司,其核心团队自几年前就开始研究相关技术。公司最近推出了智象多模态生成大模型3.0版本和理解大模型1.0。CTO姚霆认为,不需要等到基础模型达到完美才能应用,关键在于找到解决用户痛点的场景,并在应用上做到端到端的95分以上。智象多模态生成大模型3.0在画面质量、镜头运动和特色场景生成效果等方面进行了优化,采用了Diffusion Transformer (DiT) + Autoregressive model (AR)的混合架构,提升了生成质量和可控性,同时加快了推理速度。公司还注重影视级运镜和画面运动的自然度,以及在特色场景下的应用效果。
智象未来还推出了智象多模态理解大模型1.0,通过对物体和事件的建模,实现了更精细的图像与视频内容理解,服务于理解增强的多模态生成技术。公司构建了一个多模态检索和内容编辑与生成的创作平台,用户只需输入文字描述即可搜索和编辑视频片段,降低了创作门槛,提高了效率。
智象未来的理念是在基础模型的通用性和垂直应用的泛化性之间寻找平衡,以应用为导向,而非追求AGI。公司已服务全球一百多个国家和地区的一千多万个人用户和四万多家企业客户。智象未来获得数亿元人民币Pre-A和A轮融资,领投方包括敦鸿资本和合肥产投等。公司将继续致力于解决用户最后“一公里”的问题,让AIGC技术普及。
原文和模型
【原文链接】 阅读原文 [ 3176字 | 13分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...