大模型

LLM,VLM,模型

谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩

这篇文章介绍了谷歌最新提出的Infini-attention机制,该机制能够使Transformer架构的大模型在有限的计算资源下处理无限长的输入,并实现114倍的内存压缩比。I...

谷歌、OpenAI、Mistral 在24小时内打响科技界“三强争霸赛”

本周,谷歌、OpenAI和Mistral在人工智能领域展开了激烈的竞争。谷歌发布了Gemini 1.5 Pro的公开预览版,这是功能最强大的生成式AI模型之一,能够处理更大的上...

百度Create AI开发者大会剧透丨用好三大AI神器 ,人人都是开发者

这篇文章主要介绍了百度在AI领域的最新进展,包括AgentBuilder、AppBuilder和ModelBuilder三大AI开发工具的应用。首先,AgentBuilder作为智能体构建平台,提...

离开百度7年后,吴恩达终于大厂“再就业”:加入亚马逊董事会,帮其实现AI大志

亚马逊近期宣布计算机科学家吴恩达加入董事会,成为董事会成员之一。吴恩达被认为在人工智能领域具有丰富经验,将为亚马逊提供关于人工智能机遇和挑战的见解...

音乐版Sora!文生超逼真歌曲,可自定义歌词、时间延长

4月11日,前谷歌Deepmind研究人员开发的文生音乐产品Udio全面免费开放测试。根据'AIGC开放社区'的实际使用体验,Udio在音乐质量、混音、情感表达、留白、通透...

CVPR 2024丨文本或图像提示精准编辑 3D 场景,美图&信工所&北航&中大联合提出 3D 编辑方法 CustomNeRF

美图影像研究院(MT Lab)联合中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了一种名为CustomNeRF的3D场景编辑方法。这项技术允许使用文本...

被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线

面壁智能团队在大模型领域的探索与实践面壁智能团队,由曾国洋担任CTO,自2020年GPT-3发布后开始训练大模型,逐渐认识到提升模型效果是大模型训练的根本目标...

史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录

在最近的一项研究中,由印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者合作开发的人工智能模型AlphaGeometry,结合了1970年代吴文俊提出的吴方法...

代码大模型再现国之利刃,开源aiXcoder-7B性能完爆同级大模型!

在人工智能技术推动各行各业创新的背景下,国产大模型aiXcoder 7B引起了广泛关注。北京大学软件工程研究所的aiXcoder团队开源的这一模型,不仅助力国内软件企...

斯坦福、伯克利大神教授创业给机器人造大脑,OpenAI红杉抢着投5亿

近日,ALOHA家务机器人项目的导师、斯坦福大学教授Chelsea Finn宣布与伯克利大学学者和谷歌DeepMind科学家共同创业,成立了名为Physical Intelligence(简称P...
1 309 310 311 312 313 447