“机器之心”的搜索结果

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2
SnapChat背后的公司Snap联合特伦托大学等机构发布了一款名为Snap Video的文本生成视频模型。该模型采用了可扩展的时空Transformer架构,...
微软37页论文逆向工程Sora,得到了哪些结论?
摘要:本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频...
白宫发文,呼吁开发者放弃C、C++:Rust被「钦点」内存安全
美国官方机构再次呼吁放弃使用C和C++,转而使用内存安全的编程语言,如Rust。白宫国家网络主任办公室(ONCD)在一份报告中强调,选择内...
“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资
联汇科技近日宣布完成数亿元战略融资,投资方包括中国移动产业链发展基金中移和创投资等。本轮融资将用于多模态大模型及自主智能体的技...
ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transfo...
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
Meta的LLaMa 3模型正在开发中,旨在解决LLaMa 2在回答有争议问题时的保守性问题。LLaMa 2在处理极端情况时的保守性是必要的,如暴力或非...
微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41
摘要:近期,微软研究院、国科大等机构的研究者提出了一种革命性的1-bit大模型,这一技术在AI领域引起了广泛关注。该研究通过将大模型的...
让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了
摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实...
基于神经网络的偏微分方程求解器新突破:北大&字节研究成果入选Nature子刊
摘要:北京大学与字节跳动研究部门 ByteDance Research 联合开发的计算框架 Forward Laplacian 在量子化学领域取得了显著进展。该框架通...
1 48 49 50 51 52 55