标签:多模态AI
从骁龙8至尊版,我看到了AI手机的未来 | 智在终端
2024年最后一季度,安卓市场因骁龙8至尊版的发布而再次火热。AI成为手机市场的核心关键词,各大厂商通过实际进展证明端侧AI已成为手机竞争的新焦点。骁龙8至...
Sora终于来了,但多模态AI呼唤实用主义
OpenAI发布的视频生成模型Sora Turbo在实测中未能超越市场上现有视频模型,存在视频时长、生成效果一致性、指令遵循等方面的不足。Sora项目被比作视频版GPT-1...
实时音视频领域拓荒者的十年
实时对话式AI的机遇正在被业界广泛讨论和探索。RTE(实时互联网)大会自2015年引入中国以来,已发展成为全球规模最大的音视频行业峰会,吸引了众多行业专家和...
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
在CNCC 2024上,智谱展示了其最新的多模态AI技术成果,其中包括AutoGLM,一个能够模拟用户操作手机和浏览器的智能体,以及GLM-4-Voice情感语音模型,后者以其...
谷歌计划将 Gemini 并入 Deepmind,下个月开始生效
谷歌近期进行了重要的人事调整和组织架构变动,以加强其在人工智能领域的竞争力。尼克·福克斯(Nick Fox)接替普拉巴卡尔·拉加万(Prabhakar Raghavan)成为...
AI教父Hinton万字访谈: 人类可能只是AI演化过程中的一个过渡阶段
2023年5月,AI领域的先驱人物杰弗里·辛顿(Geoffrey Hinton)宣布离开谷歌,并在MIT的一场分享会上详细阐述了他对人工智能的担忧。辛顿的发言引起了广泛关注...
一手实测结果出炉!智谱「超大杯」模型全家桶亮相KDD,部分任务超越GPT-4o
在KDD 2024大会上,中国的大模型技术取得了显著进展。智谱AI的顾晓韬博士介绍了支持中英双语的对话机器人ChatGLM,以及智谱基础模型的重大升级——GLM-4-Plus。...
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
Meta公司最新发布的Transfusion模型,成功实现了语言模型和图像生成的统一,为多模态AI模型的发展迈出了重要一步。Transfusion模型融合了Transformer和Diffus...
一夜之间,谷歌版GPT-4o和AI手机全上市了
谷歌在Made by Google活动上发布了Gemini Live,这是一款与OpenAI的高级语音模式GPT-4o竞争的产品。Gemini Live提供了一种移动对话体验,允许用户与Gemini进...
重磅!OpenAI与苹果合作,将ChatGPT集成在iOS 18中
在最新的技术合作中,OpenAI与苹果公司携手,将ChatGPT深度集成至苹果产品矩阵中,涵盖iOS、iPadOS和macOS。苹果采用的ChatGPT技术由GPT-4o提供支持,这是Ope...
1
2