标签:大语言模型

OpenAI掀桌子!免费提供GPT-4o mini微调,每天200万tokens

AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。OpenAI宣布在特定时间内为4级、5级用户提供GPT-4o min...

谷歌、Anthropic推出创新神经压缩Equal-Info Windows

谷歌DeepMind和Anthropic的研究人员共同开发了一种名为Equal-Info Windows的创新神经压缩方法,旨在解决大语言模型(LLM)训练成本高昂的问题。随着LLM如Chat...

从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」

在人工智能领域,大语言模型(LLM)的控制与指导是核心挑战之一。早期,人类反馈的强化学习方法(RLHF)被用来管理这些模型,取得了显著成效。然而,RLHF在训...

超GPT-4o,代码能力超强!Claude 3.5 Sonnet正式发布

这是Claude 3.5系列中的首个模型,也是Anthropic目前最强的视觉模型。Sonnet的性能不仅超过了上一代Claude 3旗舰模型Opus,还大幅度超越了OpenAI的GPT-4o和谷...

谷歌推出V2A,可为视频大模型自动匹配语音

专注于AIGC领域的专业社区,关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态。谷歌Deepm...

ChatGPT等模型疯狂训练,最快2026年消耗尽公开文本数据

Epochai发布了一份关于大语言模型(LLM)训练数据消耗的研究报告,指出目前全球公开的高质量文本训练数据集约为300万亿tokens。然而,随着像ChatGPT这样的模...

现在起,真正的强者敢于直面「扣子」的「模型广场」

是字节推出的一个在线大语言模型对比与评估系统。它允许用户通过多种模式对比不同大语言模型的能力,包括指定 Bot 对战、随机 Bot 对战以及纯模型对战。这种...

能精准解读X光片,开源视觉大模型Dragonfly

Together.ai最近开源了名为Dragonfly的大语言模型,该模型具有多分辨率视觉编码功能。Dragonfly设计了两个版本:Llama-3-8b-Dragonfly-v1和Llama-3-8b-Dragon...

复旦邱锡鹏教授讲述MOSS 2 研发进展:如何实现世界模型?

复旦大学计算机学院教授邱锡鹏在CCF大模型论坛上,分享了复旦大学自然语言处理实验室在对话式大语言模型MOSS研发的最新进展。他指出,MOSS初代技术框架基于GP...

Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想

在人工智能领域,大语言模型(LLM)正受到广泛关注,因其强大的语言理解和生成能力在各种应用中展现出巨大潜力。然而,这些模型的内部运作机制,特别是神经活...
1 2 3 4 8