标签:大型语言模型
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型,该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等竞争对手。...
超级Prompt:几行乱码让大模型获得科学思维,这个神奇的提示词突然火了
近日,一个名为Super Prompt的GitHub项目在短时间内迅速获得了2000个星标,引起了广泛关注。该项目由两个Markdown文件组成,其中一个是流程图,另一个是包含...
李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享
李沐,一位在人工智能领域享有盛誉的专家,近日在上海交通大学(上交大)的演讲吸引了大量学生和教职工的热烈追捧,现场座无虚席,甚至演讲结束后学生们仍热...
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
Llama 3.1是由Meta公司发布的新一代大型语言模型,其上下文长度扩展至128K,并推出了8B、70B和405B三个版本,显著提升了大模型赛道的竞争标准。Llama 3.1 405...
Lllama 3 诞生,开源模型首次击败当今最强闭源模型。开源万岁!
Meta公司发布了新一代开源大型语言模型(LLM)——Llama 3.1系列,包括8B、70B和405B三个尺寸的模型。其中,405B模型包含4050亿个参数,是首个前沿级别的开源AI...
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
FlashAttention-3是针对H100 GPU优化的第三代FlashAttention技术,它在前一代的基础上实现了1.5至2倍的速度提升,将H100 GPU的FLOPs利用率提高到了75%。Flash...
李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
他们认为,尽管LLM在某些任务上表现出超人类智能,但它们并不具备感觉能力。感觉是智能的基本特征之一,拥有主观经验的能力,例如感受饥饿、疼痛和看到颜色。...
三行命令,大模型让 Excel 直接回答问题
在数据处理与分析领域,大型语言模型(LLM)正在引领潮流,展现出超越传统文本应用的突破性功能。其中,利用LLMs解读和推理表格数据是一个值得关注且潜力巨大...
使用大模型进行股票预测,收益率16.6%,还会自我反思和给出合理解释
本文介绍了一种名为Summarize-Explain-Predict (SEP)的框架,该框架使用大型语言模型(LLMs)生成可解释的股票预测。SEP框架通过自我反思的代理和Proximal Po...
「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系
摘要#### 引言GraphEdit是一种新颖的图结构学习(GSL)方法,旨在通过大型语言模型(LLMs)优化图网络,有效去除噪声连接并识别节点间的隐性依赖关系。该方法...
1
2