大模型

LLM,VLM,模型

PLAUD创始人访谈:AI录音硬件,全球超20 万用户,如何做到的?

PLAUD NOTE是一款集成了AI技术的录音硬件产品,凭借其独特的功能和良好的用户体验,成为了AI硬件领域的成功案例。该产品不仅累计出货量超过10万台,而且在用...

视频、图像、文本,只需基于下一个Token预测:智源Emu3发布,验证多模态模型新范式

智源研究院于2024年10月21日发布了原生多模态世界模型Emu3,这是一个基于下一个token预测的模型,能够在无需扩散模型或组合方法的情况下,完成文本、图像、视...

Ilya观点得证!仅靠预测下一个token统一图像文本视频,智源发布原生多模态世界模型Emu3

智源研究院发布了原生多模态世界模型Emu3,该模型基于下一个token预测,无需依赖扩散模型或组合方法,能够完成文本、图像、视频三种模态数据的理解和生成。Em...

突发!微软正与OpenAI洽谈,140亿美元投资股权

微软与OpenAI的谈判焦点在于140亿美元的投资股权分配和公司治理控制权。微软作为OpenAI的最大股东,其在公司治理和发展方向上的实际控制权是谈判的核心。由于...

我们能够让开源小模型变得比人类更聪明吗

本文由安全研究员Harish SG撰写,旨在探讨如何提升开源大语言模型(LLM)的推理能力,以期达到或超越闭源模型的性能。Harish SG是德克萨斯大学达拉斯分校网络...

卷疯了!美国AI博士生「人手10篇顶会」,遭欧洲同行质疑

欧洲博士生在机器学习社区发表的帖子引发了广泛讨论,他质疑为何美国博士生能在AI顶会上发表如此多的论文。他分享了自己的经历,包括在CVPR上发表论文和管理...

Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散

智源研究院最近发布了一款名为Emu3的原生多模态世界模型,该模型通过预测下一个token来理解和生成文本、图像和视频三种模态数据,而无需依赖扩散模型或组合方...

上海交大、腾讯发布高效扩散模型微调方法,提升图像生成效率

近年来,扩散模型在图像、视频和3D生成等任务中发挥了重要作用,但在将预训练模型微调应用于实际业务场景时面临挑战。现有微调方法如AFT、RFT和SFT存在局限性...

假装被马斯克裁员的整活鬼才,现在AI创业融资3500万

Daniel Francis,曾因在马斯克收购推特后大裁员时冒充被裁员工而出名,最近他的创业公司Abel获得了500万美元融资。Abel开发了一款辅助警察完成文书工作的应用...

智源 Emu3 证明多模态模型新范式:只需基于下一个 token 预测

智源研究院于2024年10月21日发布了原生多模态世界模型Emu3,这一模型仅通过预测下一个token,就能实现对文本、图像、视频三种模态数据的理解和生成,无需依赖...
1 90 91 92 93 94 446