大模型

LLM,VLM,模型

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

这篇文章介绍了一种名为InfLLM的方法,旨在解决大型语言模型在处理超长文本时的能力瓶颈。传统大型模型在处理超长文本时往往无法记忆和理解足够长的上下文信...

「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

摘要#### 引言GraphEdit是一种新颖的图结构学习(GSL)方法,旨在通过大型语言模型(LLMs)优化图网络,有效去除噪声连接并识别节点间的隐性依赖关系。该方法...

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

程博文是一位华人科学家,曾在特斯拉自动驾驶部门工作,最近宣布将加入OpenAI的后训练团队,专注于多模态模型的研究。他毕业于伊利诺伊大学厄巴纳-香槟分校,...

兼职创业,一个人如何在半年内把 AI+Excel 的项目做到 31 万美金 ARR?

步骤2:撰写详细摘要总结并加粗重点这篇文章讲述了一个名为formulabot的AI+Excel项目的创业故事。创始人David Bressler在兼职状态下,用半年时间将其做到了31...

ChatGPT每年电费2亿?! 日耗电量≈1.7万个家庭, 网友:挺值!

步骤2: 内容摘要本文主要讨论了ChatGPT等人工智能模型的高能耗问题。根据相关研究估算,ChatGPT每天消耗的电量相当于1.7万个美国家庭的日耗电量,约50万度电。...

AI教父Hinton最近对人工智能的7个观点

步骤2 - 撰写摘要:Geoffrey Hinton教授,被称为'人工智能教父'和'神经网络之父',最近在牛津大学的一次演讲中,从哲学角度对AI的未来走向提出了重要思考。他认为...

目标3-6月内赶超Sora,「爱诗科技」获达晨亿元级A1轮融资 | 智涌首发

爱诗科技完成亿级A1轮融资,由达晨财智独家投资,光源资本担任财务顾问。公司计划将资金用于视频大模型技术研发和团队建设。爱诗科技由字节跳动前视觉技术负...

谷歌遭遇诺基亚式颠覆,是灭亡还是机遇?

以下是根据所提供的文章内容撰写的详细分段摘要总结,并在重点词语和句子上使用HTML标签进行加粗显示:1. 科技领域的独特魅力在于永不停歇的创新与变革。微软...

当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」

摘要总结:本文探讨了大语言模型(LLMs)在处理复杂任务时的局限性,并提出了一种新的基于分治算法的提示策略(Divide-and-Conquer, DaC),以提高模型在面对...

DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

华为诺亚方舟实验室的研究者们提出了一种名为DenseSSM的新方法,用于改进状态空间模型(SSM)中的隐藏信息流动。DenseSSM通过在不同层之间有选择性地整合浅层...
1 317 318 319 320 321 393