大模型

清华NLP组发布InfLLM：无需额外训练，「1024K超长上下文」100%召回！

这篇文章介绍了一种名为InfLLM的方法，旨在解决大型语言模型在处理超长文本时的能力瓶颈。传统大型模型在处理超长文本时往往无法记忆和理解足够长的上下文信...

AIGC动态

9个月前

摘要#### 引言GraphEdit是一种新颖的图结构学习（GSL）方法，旨在通过大型语言模型（LLMs）优化图网络，有效去除噪声连接并识别节点间的隐性依赖关系。该方法...

AIGC动态

9个月前

程博文是一位华人科学家，曾在特斯拉自动驾驶部门工作，最近宣布将加入OpenAI的后训练团队，专注于多模态模型的研究。他毕业于伊利诺伊大学厄巴纳-香槟分校，...

AIGC动态

9个月前

步骤2：撰写详细摘要总结并加粗重点这篇文章讲述了一个名为formulabot的AI+Excel项目的创业故事。创始人David Bressler在兼职状态下，用半年时间将其做到了31...

AIGC动态

9个月前

步骤2: 内容摘要本文主要讨论了ChatGPT等人工智能模型的高能耗问题。根据相关研究估算,ChatGPT每天消耗的电量相当于1.7万个美国家庭的日耗电量,约50万度电。...

AIGC动态

9个月前

步骤2 - 撰写摘要:Geoffrey Hinton教授,被称为'人工智能教父'和'神经网络之父',最近在牛津大学的一次演讲中,从哲学角度对AI的未来走向提出了重要思考。他认为...

AIGC动态

9个月前

爱诗科技完成亿级A1轮融资，由达晨财智独家投资，光源资本担任财务顾问。公司计划将资金用于视频大模型技术研发和团队建设。爱诗科技由字节跳动前视觉技术负...

AIGC动态

9个月前

以下是根据所提供的文章内容撰写的详细分段摘要总结，并在重点词语和句子上使用HTML标签进行加粗显示：1. 科技领域的独特魅力在于永不停歇的创新与变革。微软...

AIGC动态

9个月前

摘要总结：本文探讨了大语言模型（LLMs）在处理复杂任务时的局限性，并提出了一种新的基于分治算法的提示策略（Divide-and-Conquer, DaC），以提高模型在面对...

AIGC动态

9个月前

华为诺亚方舟实验室的研究者们提出了一种名为DenseSSM的新方法，用于改进状态空间模型（SSM）中的隐藏信息流动。DenseSSM通过在不同层之间有选择性地整合浅层...

AIGC动态

9个月前