大模型
LLM,VLM,模型
GPT-4惨遭黑客利用!勒索软件20分钟加密100GB数据,竟被ta阻止了
在大模型落地应用的元年2024年,网络黑客已经开始利用大模型如ChatGPT等来完善和改进他们的网络攻击。黑客利用大模型生成网络钓鱼邮件和代码,研究卫星通信和...
通用文档理解新SOTA,多模态大模型TextMonkey来了
华中科技大学和金山的研究人员在多模态大模型Monkey的基础上提出了TextMonkey,这是一个专注于文本相关任务的多模态大模型。TextMonkey在多个场景文本和文档...
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年8月,前谷歌研究人员David Ha和Llion Jones创立了位于日本东京的人工智能公司Sakana AI,其中Llion Jones是谷歌2017年经典研究论文《Attention is all yo...
讨论下一个token预测时,我们可能正在走进陷阱
机器之心报道,编辑赵阳,最近围绕下一个token预测的讨论日益激烈。然而,许多人认为,下一个token预测的目标无法真正模拟人类思维。人类在执行计划之前会在...
OpenAI公关跳起来捂他嘴:Transformer作者公开承认参与Q*!|八位作者最新专访
本文讲述了Transformer架构的发展历程,这是一项对AI领域产生重大影响的技术。Transformer的发明者之一,Lukasz Kaiser,公开承认参与了OpenAI的Q*项目,但关...
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器
剑桥大学信息工程系人工智能实验室最近开源了首个预训练、通用多模态后期交互知识检索器PreFLMR。该模型基于Fine-grained Late-interaction Multi-modal Retr...
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了
这篇文章介绍了日本大模型公司提出的一种新颖的模型合并方法,旨在自动生成新的基础模型而无需进行梯度训练。他们使用进化算法引入了“进化模型合并”(Evoluti...
Sora场景转「3D资产」!浙大CAD&CG全重实验室提出文本转3D新SOTA:多功能、可拓展
新智元报道了一种名为3D-SceneDreamer的新型3D场景生成工具,该工具采用基于Stable Diffusion的Inpainting模型,结合单目深度方法,以优化场景的三维结构。3D...
词曲创作只需几秒,「AI作曲家」Suno引爆音乐圈,第一手体验和攻略来了
近期,一款名为Suno的AI驱动歌曲生成器在社区内迅速传播,被称为“音乐界的ChatGPT”。Suno可以根据简单的提示创建从歌词到人声和配器的所有内容,用户可以引导...
3月AI投融资:字节首投芯片公司;阿里刚投Kimi又投MiniMax;苹果收购AI系统
2024年,围绕AI领域的投融资和并购活动依然火热。国内大模型公司如月之暗面、智谱、MiniMax、生数科技、爱诗科技以及新生的若愚科技等相继获得新一轮融资,大...