免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考

AIGC动态13小时前发布 AIGCOPEN
82 0 0
免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考

 

文章摘要


【关 键 词】 大模型多模态智能体免费使用创新技术

百度近日发布了两款大模型——文心4.5和X1,均已上线并免费向用户开放。文心4.5是一款多模态模型,能够对文字、图片、视频、音频等多种内容进行综合解读,其能力在多个方面超越了OpenAI的GPT-4。X1则具备深度思考能力,支持多模态,并能自动调用多种高级工具,如搜索、文档问答、AI绘图等,展现出强大的推理能力。

文心4.5在多模态理解方面表现出色,尤其是在视频解读领域,能够高效准确地分析全新未知内容。例如,在对美国陆军AI模型驱动的军事情报战车TITAN宣传视频的解读中,文心4.5展示了其基于多模态的理解能力,解读结果准确且高效。此外,文心4.5在音频解读方面同样表现优异,支持多种音频格式,用户可上传多个音频进行快速分析。

X1的独特之处在于其深度思考模式,能够自动调用多种工具进行复杂任务的处理。例如,在解读电影《肖申克的救赎》海报时,X1自动调用图片理解工具,对图片的主题、背景、风格等进行了详细分析。此外,X1还能根据用户需求生成特定风格的文本,如影评,展现出其灵活的应用能力。

在技术架构方面,文心4.5采用了FlashMask动态注意力掩码、多模态异构专家扩展、时空维度表征压缩技术等创新技术,显著提升了多模态理解和生成的效率与效果。这些技术解决了传统模型在处理长序列和多模态数据时的瓶颈问题,使模型在复杂场景下的表现更加出色。

X1则应用了基于思维链和行动链的端到端训练方式,通过将输入直接映射到输出,避免了传统多阶段训练中的信息丢失和误差累积问题。这种训练方式显著提升了模型在深度搜索场景中的表现,使其能够更好地理解用户意图并提供精准的搜索结果。

百度表示,未来将开源文心4.5大模型,进一步推动大模型技术的发展和应用。这两款大模型的发布,不仅展示了百度在AI领域的创新能力,也为用户提供了强大的工具,助力其在多模态理解和深度思考任务中取得更好的成果。

原文和模型


【原文链接】 阅读原文 [ 1931字 | 8分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...