大模型
LLM,VLM,模型
The Information爆料:OpenAI调整大模型方向,Scaling Law撞墙?
根据研究预测,大型语言模型(LLM)的发展可能在2028年因数据储量耗尽而放缓。然而,The Information的报道指出,OpenAI的下一代模型提升幅度不及前代,AI产...
LoRA、完全微调到底有何不同?MIT 21页论文讲明白了
本研究旨在探讨完全微调和低秩自适应(LoRA)两种微调大型语言模型方法之间的差异。微调是将预训练的大型语言模型应用于特定下游任务的关键步骤,而LoRA方法...
浙大开源“最懂Excel的GPT”!首次将结构化数据作为独立模态训练,刷榜提升40百分点
浙江大学博导赵俊博领衔的团队开发了TableGPT2,这是一个能够理解复杂表格并进行计算的最新模型。TableGPT2首次将结构化数据作为独立模态进行训练,使得大模...
过去一年我开发 AI 视频编辑器的收获
Kirk Kaiser在离开原公司后,投身于探索大语言模型(LLM)、扩散模型等在视频领域的新应用。他曾参与打造一个独角兽级别的生成式视频编辑器,并希望实现一些...
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
OpenAI正面临人工智能大模型改进速度放缓的问题,其新模型Orion在完成20%训练后已达到GPT-4水平,但整体质量提升有限,特别是在编码等领域。开发速度放缓的原...
王炸开源!谷歌开源诺奖化学模型Alphafold-3,一夜改变世界!
谷歌DeepMind的AlphaFold-3蛋白质预测模型近日开源,这一事件在科研领域引起了广泛关注。AlphaFold-3因其在蛋白质结构预测方面的高准确率而获得诺贝尔化学奖...
Vast 创始人&CEO宋亚宸:让每个人都能生成独一无二的3D模型
在硅星人首届AI创造者大会(ACC 2024)上,Vast公司创始人兼CEO宋亚宸介绍了3D生成技术的最新发展。Vast的Tripo模型能够通过文字、图片或多模态输入生成包含...
真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
字节跳动豆包大模型团队推出了国内首个产品化的通用图像编辑模型SeedEdit,该模型通过简单的自然语言指令即可实现图像编辑,无需复杂的描边涂抹。SeedEdit能...
重磅!波士顿动力创始人出席,钛媒体2024 T-EDGE豪华启动!
波士顿动力公司的最新视频展示了其双足人形机器人Atlas在日本丰田汽车厂中的工作能力。Atlas通过机器学习和自主人工智能模型,实现了自行导航,能够检测定位...
著名 AI 学者、天工智能首席科学家颜水成离开昆仑万维,去年 9 月入职
AI领域国际顶尖学者颜水成已离开昆仑万维。颜水成拥有丰富的学术和工作经历,包括在北京大学数学系学习、微软亚洲研究院实习、香港中文大学从事人脸识别研究...