大型语言模型 | 学习AIGC

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

华为诺亚方舟实验室提出的Pangu DeepDiver模型通过Search Intensity Scaling（SIS）技术，实现了大型语言模型（LLM）与搜索引擎的自主交互，显著提升了7B参数...

AI-Agent

3个月前

AISuite：一个新的开源 Python 库，提供了统一的跨 LLM API

吴恩达最近推出了`aisuite`，这是一个旨在为流行的大型语言模型（LLM）提供统一API的平台，类似于OpenAI的API。这个工具的目的是简化在同一个应用程序中使用...

AIGC动态

8个月前

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

最近，UCL和Cohere等机构的研究人员发现，在执行推理任务时，大型语言模型（LLM）表现出一种“程序性知识”。这项研究挑战了人们对于LLM仅通过简单检索来推理的...

AIGC动态

9个月前

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型，该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等竞争对手。...

AIGC动态

10个月前

超级Prompt：几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

近日，一个名为Super Prompt的GitHub项目在短时间内迅速获得了2000个星标，引起了广泛关注。该项目由两个Markdown文件组成，其中一个是流程图，另一个是包含...

AIGC动态

12个月前

李沐重返母校，上交大秒变追星现场，大模型趋势无保留分享

李沐，一位在人工智能领域享有盛誉的专家，近日在上海交通大学（上交大）的演讲吸引了大量学生和教职工的热烈追捧，现场座无虚席，甚至演讲结束后学生们仍热...

AIGC动态

1年前 (2024)

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

Llama 3.1是由Meta公司发布的新一代大型语言模型，其上下文长度扩展至128K，并推出了8B、70B和405B三个版本，显著提升了大模型赛道的竞争标准。Llama 3.1 405...

AIGC动态

1年前 (2024)

Lllama 3 诞生，开源模型首次击败当今最强闭源模型。开源万岁！

Meta公司发布了新一代开源大型语言模型（LLM）——Llama 3.1系列，包括8B、70B和405B三个尺寸的模型。其中，405B模型包含4050亿个参数，是首个前沿级别的开源AI...

AIGC动态

1年前 (2024)

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

FlashAttention-3是针对H100 GPU优化的第三代FlashAttention技术，它在前一代的基础上实现了1.5至2倍的速度提升，将H100 GPU的FLOPs利用率提高到了75%。Flash...

AIGC动态

1年前 (2024)

李飞飞亲自撰文：大模型不存在主观感觉能力，多少亿参数都不行

他们认为，尽管LLM在某些任务上表现出超人类智能，但它们并不具备感觉能力。感觉是智能的基本特征之一，拥有主观经验的能力，例如感受饥饿、疼痛和看到颜色。...

AIGC动态

1年前 (2024)

标签：大型语言模型

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

AISuite：一个新的开源 Python 库，提供了统一的跨 LLM API

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

英伟达开源最新大模型Nemotron 70B后，只有OpenAI o1一个对手了

超级Prompt：几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

李沐重返母校，上交大秒变追星现场，大模型趋势无保留分享

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

Lllama 3 诞生，开源模型首次击败当今最强闭源模型。开源万岁！

Mamba一作再祭神作，H100利用率飙至75%！FlashAttention三代性能翻倍，比标准注意力快16倍

李飞飞亲自撰文：大模型不存在主观感觉能力，多少亿参数都不行

热门网址

标签：大型语言模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址