标签:多模态
AI 最好的载体,为什么只能是 AR 眼镜?
AGI技术的发展打破了可穿戴设备的功能、形态和成本之间的不可能三角,使得超强功能得以在微小形态上实现。智能眼镜作为可穿戴设备的一种,有望在大模型的变革...
发力了,Mistral对标ChatGPT全面升级le Chat,还祭出超大杯多模态模型
Mistral AI近期推出了其多模态家族的新成员Pixtral Large,这是一个基于124B开放权重构建的超大杯基础模型,具备顶尖的图像理解能力,能够理解文档、图表和自...
Sora到底发布不发布,这事可能并不重要了
大模型技术的发展已进入缓慢迭代期,行业对OpenAI未发布的Sora模型充满期待,希望其能带来突破。然而,Sora的实现面临巨大挑战,包括高昂的成本和技术难题。...
超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!
法国开源大模型平台Mistral.ai最近开源了超大多模态模型Pixtral Large,该模型拥有1240亿参数,支持128K上下文,并能理解文本、图表、图像等。Pixtral Large...
斯坦福伯克利重磅发现DNA Scaling Law,Evo荣登Science封面!AI设计DNA/RNA/蛋白质再突破
斯坦福和UC伯克利的研究人员开发了一种名为Evo的基因组基础大模型,该模型在AI设计DNA、RNA和蛋白质序列方面取得了颠覆性突破。Evo模型拥有70亿参数,能在单...
AI创作真正All in One的大模型产品竟然是它?
百度在2024年百度世界大会上发布了名为“自由画布”的AI创作新物种,由百度文库和百度网盘联合出品,旨在打造一个智能生产力的All in One平台。自由画布是行业...
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
中国生数科技推出的Vidu 1.5模型,成为全球首个支持多主体一致性的多模态视频生成模型,颠覆了传统单点微调方法,标志着视频模型统一理解和生成的飞跃。Vidu ...
百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
百度推出了名为“自由画布”的AI创作工具,它是一个多模态大模型支持的万能白板,能够处理任何格式的素材输入,并生成用户所需的任何格式内容。这个工具无需特...
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
斯坦福大学李飞飞和吴佳俊团队推出了HourVideo,一个旨在评估多模态模型对长达一小时视频理解能力的基准数据集。HourVideo包含500个来自Ego4D数据集的第一人...
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
智谱公司推出的新AI技术“清影”标志着国产AI在视频生成领域的一大进步,将视频生成技术带入了有声电影时代。清影具备三大特点:电影级效果,支持4K、60帧高清...