“多模态”的搜索结果
豆包吃到了大模型PC端的螃蟹?
在近期市场动态中,字节跳动推出了AI助手豆包的PC客户端,与此同时,OpenAI也推出了多模态生成模型GPT-4o的桌面App。这一举动显示出AI大...
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
斯坦福团队的多模态大模型Llama3-V被指与清华大学团队的面壁智能MiniCPM-Llama3-V 2.5开源模型高度相似。Llama3-V团队的两位斯坦福本科...
英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」
本文介绍了一种称为“具身智能”的人工智能技术,它旨在将虚拟世界的成果转移到现实世界中。具身智能的研究包括以下几个方面:1. Minecraf...
斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
斯坦福团队在Medium发布的文章中宣称,他们训练出了一个小型多模态模型Llama 3-V,其性能超越了GPT-4V、Gemini Ultra和Claude Opus等模...
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
在GPT-4o问世后,Llama3的地位受到挑战。然而,斯坦福团队推出的Llama3-V引发关注,这一模型以仅500美元的成本,实现了与GPT4-V、Gemini...
不想炸薯条的Ilya和不送GPU的英伟达,Hinton最新专访:道路千万条,安全第一条
这篇采访文章详细总结了人工智能之父Hinton的心路历程和思考。主要内容包括:1. Hinton曾学习生理学和哲学,希望弄清人脑工作原理,但未...
中国版 Runway 新功能上线,图生视频动效更强
爱诗科技发布的视频生成工具PixVerse,最新上线了Magic Brush运动笔刷功能。该功能允许用户通过涂抹区域和绘制轨迹的方式,对视频中的多...
GPT-4o 引爆小红书打卡潮,推动 Vision Pro想象,刷新微软、Adobe 产品线
GPT-4o 的多模态视觉能力引发了社交媒体上的热议,尤其是在小红书上,用户们热衷于测试其识别街景的能力。与其它多模态 AI 模型相比,GP...
罕见同台:xAI、Llama 3和Mistral的核心科学家对谈,详解三家最强模型背后的一切
这篇文章讨论了生成式人工智能在硅谷的发展现状和展望,重点围绕了xAI、Llama和Mistral AI等公司的最新动态展开。文章总结了几个关键点...
ChatGPT Edu版本来啦:支持GPT-4o、自定义GPT、数据分析等
OpenAI最近推出了专门针对大学校园的ChatGPT Edu版本,这一新版本支持GPT-4o、网络搜索、数据分析、代码生成等功能,旨在提升学习和教学...