标签:大型语言模型
AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API
吴恩达最近推出了`aisuite`,这是一个旨在为流行的大型语言模型(LLM)提供统一API的平台,类似于OpenAI的API。这个工具的目的是简化在同一个应用程序中使用...
AI做数学学会「动脑子」! UCL等发现LLM「程序性知识」,推理绝不是背答案
最近,UCL和Cohere等机构的研究人员发现,在执行推理任务时,大型语言模型(LLM)表现出一种“程序性知识”。这项研究挑战了人们对于LLM仅通过简单检索来推理的...
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型,该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等竞争对手。...
超级Prompt:几行乱码让大模型获得科学思维,这个神奇的提示词突然火了
近日,一个名为Super Prompt的GitHub项目在短时间内迅速获得了2000个星标,引起了广泛关注。该项目由两个Markdown文件组成,其中一个是流程图,另一个是包含...
李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享
李沐,一位在人工智能领域享有盛誉的专家,近日在上海交通大学(上交大)的演讲吸引了大量学生和教职工的热烈追捧,现场座无虚席,甚至演讲结束后学生们仍热...
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
Llama 3.1是由Meta公司发布的新一代大型语言模型,其上下文长度扩展至128K,并推出了8B、70B和405B三个版本,显著提升了大模型赛道的竞争标准。Llama 3.1 405...
Lllama 3 诞生,开源模型首次击败当今最强闭源模型。开源万岁!
Meta公司发布了新一代开源大型语言模型(LLM)——Llama 3.1系列,包括8B、70B和405B三个尺寸的模型。其中,405B模型包含4050亿个参数,是首个前沿级别的开源AI...
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
FlashAttention-3是针对H100 GPU优化的第三代FlashAttention技术,它在前一代的基础上实现了1.5至2倍的速度提升,将H100 GPU的FLOPs利用率提高到了75%。Flash...
李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
他们认为,尽管LLM在某些任务上表现出超人类智能,但它们并不具备感觉能力。感觉是智能的基本特征之一,拥有主观经验的能力,例如感受饥饿、疼痛和看到颜色。...
三行命令,大模型让 Excel 直接回答问题
在数据处理与分析领域,大型语言模型(LLM)正在引领潮流,展现出超越传统文本应用的突破性功能。其中,利用LLMs解读和推理表格数据是一个值得关注且潜力巨大...
1
2