标签:多模态
Gemini 2.0发布!主打Agent+多模态,性能超1.5 Pro、可直接生成音频、图片
谷歌发布了Gemini 2.0 Flash,标志着原生多模态输入输出模型时代的到来。这款模型在性能上与1.5 Pro型号相当,但成本效益、性能效率和速度均有所提升。Gemini...
智能体的未来:一家公司只需要一个 CEO?
AI Agent技术在企业中的应用与落地引起了业界的广泛关注。数势科技AI负责人李飞、小米大模型负责人栾剑和京东技术专家王译堃在AICon全球人工智能开发与应用大...
智谱CEO张鹏:不必对Scaling Law放缓表达悲观,瞄向AGI的路程还很长|2024 T-EDGE
2024年T-EDGE创新大会暨钛媒体财经年会于12月6日至7日在北京市大兴区举行,主题为“All-in on Globalization,ALL-in on AI”,聚焦人工智能对全球各行业的影响...
吴恩达发布开源 Python 库,一个接口可调用多个大模型
吴恩达最近推出了一个名为aisuite的开源Python库,旨在简化开发人员集成多个大型语言模型(LLM)的过程。该库通过提供一个标准化接口,允许用户仅通过更改一...
微软「AI伴侣」Copilot Vision,让你用嘴浏览网页,还能和你一起打游戏
微软近期推出了一款名为Copilot Vision的AI助手,该产品集成在Edge浏览器中,旨在与用户实时协作上网并提供帮助。Copilot Vision能够理解用户的在线活动上下...
OpenAI新发布:支持多模态的完全版o1和每月200刀的“天价会员”
OpenAI在新品发布会直播中推出了两项新服务:升级版的o1和ChatGPT Pro订阅计划。o1正式版在性能上比之前的版本更快、更智能,支持多模态推理,能同时处理图像...
满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元
OpenAI近日宣布了其最新人工智能模型o1的全面上线,该模型结合了多模态能力和新的推理范式,相较于之前的版本在速度和智能上都有显著提升。o1在编码、数学和...
亚马逊推出新一代基础模型 Nova:主打性价比,预告图像和视频模型
亚马逊在re:invent大会上宣布了其新一代基础模型Amazon Nova,标志着公司在生成式AI领域的重要进展。Amazon Nova系列模型支持Any to Any模态转换,即任意模态...
“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any
亚马逊云科技在re:Invent大会上宣布推出Amazon Nova系列AI多模态大模型,覆盖文本对话、图片生成和视频生成等多种功能。Amazon Nova系列模型根据功能和尺寸划...
腾讯版Sora开源!最强开源视频模型,130亿参数、物理模拟、电影级画质!
腾讯开源了名为HunyuanVideo(混元)的视频模型,这是一个拥有130亿参数的类Sora文生视频模型,是目前参数最大的开源视频模型。混元具备物理模拟、一镜到底、...