视频生成

视频,video

Scaling Law 又一次性感了吗?

专题解读事件:Sora 的出现被认为是 Scaling Law 的又一次成功,这也引起了社区中更多对 Scaling Law 的讨论。自 OpenAI 发布 Sora,业界对该模型的能力及其...

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本能力上的不足,尤其是...

拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了

  文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关注的话题。近期,Meta...

苹果终止电车项目后大裁员,押注家用机器人,这会是Next Big Thing吗?

苹果公司近期面临了一系列挑战,包括电动汽车项目的取消和 Apple Watch 屏幕生产的放弃,这些都是由于成本超支和上市延迟。这些挫折给苹果带来了巨大的收入压...

Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话

腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过2800个星标,显示出其受...

AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝

近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还能创作诗歌和配文,显...

靠“一键抠图”拿下数千万美元ARR,估值5亿美元

华纳、网飞都在使用这家法国AI初创公司的技术Photoroom是一家法国AI初创公司,专注于图像编辑技术,提供API服务,面向电商、媒体和其他用户群。该公司的技术...

Perplexity要搞竞价排名了,大模型的尽头……就还是广告?

Perplexity,一家硅谷的AI明星公司,曾以AI驱动的透明搜索体验挑战谷歌,并获得了7360万美元的融资以及社区的广泛支持。然而,这家一度鄙视广告业务的公司,...

GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动

新智元报道了关于OpenAI即将发布的GPT-5的最新动态。据报道,OpenAI已经向一些用户发送了红队测试的邀请邮件,这表明GPT-5可能已经进入红队测试阶段。红队测...
1 92 93 94 95 96 139