大模型

LLM,VLM,模型

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...

LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训

Meta的LLaMa 3模型正在开发中,旨在解决LLaMa 2在回答有争议问题时的保守性问题。LLaMa 2在处理极端情况时的保守性是必要的,如暴力或非法活动相关查询,但这...

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

摘要:近期,微软研究院、国科大等机构的研究者提出了一种革命性的1-bit大模型,这一技术在AI领域引起了广泛关注。该研究通过将大模型的权重改为三元表示,实...

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队发布了一种名为CEPE(并行编码上下文扩展)的新方法,该方法通过添加小型编码器和交叉注意力模块,扩展了预训练和指令微调模型的上下文窗口。这种...

微软6页论文爆火:三进制LLM,真香!

在最新的研究中,微软和中国中科院大学提出了一种名为BitNet b1.58的方法,标志着大语言模型(LLM)进入了“1-bit时代”。这种方法通过将传统16位浮点数存储转...

AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap

摘要总结:阿里推出了一款名为EMO的基于音频驱动的肖像视频生成框架,引起了广泛关注。用户只需提供一张参考图像和一段音频,即可生成表情生动的AI视频。这项...

突发!拜登签署行政命令,限制美国的个人数据流通,将影响国内 AI 产业发展|钛媒体AGI

摘要:美国总统拜登签署了一项行政命令,旨在限制向特定国家大规模出售美国人的个人数据。这些国家包括中国、俄罗斯、伊朗等,此举是为了保护美国人的敏感个...

比Sora惊艳!文本生成超25秒视频,带背景音乐、转场等效果

专注AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。2月29日,Lightricks宣布推出生成式AI电影制作平...

吐槽完 Sora,Google自己做的“基础世界模型”来了

Google DeepMind推出了名为「Genie」的人工智能模型,这是一个能够根据用户提示生成交互式视频游戏的AI。Genie可以将合成图像、真实照片、手绘草图或想法转换...
1 540 541 542 543 544 590