视频生成
视频,video
苹果突然裁员614人!10年造车梦碎,改押机器人搞「下一件大事」
苹果公司近期宣布了对其电动汽车项目“泰坦”的终结,这一决定导致了614名员工的裁员,这是自2020年以来苹果的首次大规模裁员。泰坦项目的关闭是为了让苹果能够...
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡
最后,机器之心还宣布将在北京海淀举办AI技术论坛,聚焦于视频生成技术、多模态大模型等前沿领域,旨在帮助企业和从业者掌握最新的技术进展。
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
斯坦福大学研究人员近日推出的 Octopus v2 模型在端侧 AI 应用领域引起了广泛关注。这个拥有 20 亿参数的模型不仅在智能手机、汽车、个人电脑等端侧设备上运...
Scaling Law 又一次性感了吗?
专题解读事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora,业界对该模型的能力及其...
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关注的话题。近期,Meta...
苹果终止电车项目后大裁员,押注家用机器人,这会是Next Big Thing吗?
苹果公司近期面临了一系列挑战,包括电动汽车项目的取消和 Apple Watch 屏幕生产的放弃,这些都是由于成本超支和上市延迟。这些挫折给苹果带来了巨大的收入压...
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还能创作诗歌和配文,显...