标签:大语言模型
能精准解读X光片,开源视觉大模型Dragonfly
Together.ai最近开源了名为Dragonfly的大语言模型,该模型具有多分辨率视觉编码功能。Dragonfly设计了两个版本:Llama-3-8b-Dragonfly-v1和Llama-3-8b-Dragon...
复旦邱锡鹏教授讲述MOSS 2 研发进展:如何实现世界模型?
复旦大学计算机学院教授邱锡鹏在CCF大模型论坛上,分享了复旦大学自然语言处理实验室在对话式大语言模型MOSS研发的最新进展。他指出,MOSS初代技术框架基于GP...
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想
在人工智能领域,大语言模型(LLM)正受到广泛关注,因其强大的语言理解和生成能力在各种应用中展现出巨大潜力。然而,这些模型的内部运作机制,特别是神经活...
Meta等最新研究:多token预测,提升大模型推理效率
在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法需要大量数据且可能降...
重磅!OpenAI发布GPT-4o,非常惊艳语音版ChatGPT!
OpenAI最近发布了其新旗舰模型GPT-4o,这是一个具有里程碑意义的事件,因为它标志着全球生成式人工智能领域的一个重大进步。GPT-4o不仅能够处理文本,还能跨...
英伟达开源大模型对齐框架—NeMo-Aligner
本文主要介绍了英伟达开源的安全对齐框架NeMo-Aligner,旨在帮助开发人员提升大语言模型(LLM)的安全性能和稳定输出。随着大模型产品如ChatGPT和Midjourney...
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
阿里巴巴的研究人员最近提出了一种名为AlphaMath的方法,该方法利用蒙特卡洛树搜索(MCTS)增强大语言模型(LLM)的性能,特别是在数学推理任务上。这项研究...
苹果开源OpenELM,大模型开源领域再迎一巨头!
4月24日,苹果开源了针对手机等移动设备的大语言模型OpenELM,与微软的Phi-3 Mini类似,提供了指令微调和预训练两种模型,分别有2.7亿、4.5亿、11亿和30亿4种...
Llama3来了!Meta:如果我给每人发一个GPT-4,阁下如何应对
今天,Meta正式发布了他们迄今为止最强大的新一代开源大语言模型Llama3。Llama3的发布包括两个版本:Llama3 8B和Llama3 70B,它们分别拥有80亿和700亿参数,...
聊聊 Kimi Chat 的种草现象
文章摘要 【关 键 词】 Kimi Chat、月之暗面、大语言模型、增长潜力、AI技术 月之暗面公司推出的大语言模型产品Kimi Chat自2023年推出以来,...