标签:语言模型
世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!
MIT计算机科学和人工智能实验室(CSAIL)的研究人员发现,大型语言模型(LLM)在训练过程中,已经发展出了对现实世界的模拟和理解。这项研究挑战了以往对LLM...
性能秒杀SD3、DALL·E-3,开源文生图模型杀出大黑马
FLUX.1是一个新兴的开源大语言模型(LLM)平台,由Robin Rombach创立,他在扩散模型领域具有权威地位。Robin曾领导全球知名的Stable Diffusion系列项目,后因...
苹果大模型最新论文:AFM 模型多维度评测「出炉」
苹果公司在全球开发者大会(WWDC)上推出了最新的个人智能系统Apple Intelligence,该系统能够深度集成到iOS 18、iPadOS 18和macOS Sequoia中。苹果在2024年...
Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o!
7月23日凌晨,Meta的新版大型语言模型(LLM)Llama 3.1 405B在4chan上泄露,并在多数基准测试中击败了GPT-4o。据悉,Meta可能很快正式发布Llama 3系列中最大...
提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使
洛桑联邦理工学院的最新研究揭示了大型语言模型在安全措施上的一个新漏洞。研究发现,通过将请求中的时间设置为过去时态,可以显著提高对GPT-4o模型的攻击成...
大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待
MMLU-Pro,一个旨在衡量大型语言模型性能的权威测试,近期遭遇了信任危机。原本被认为能为前沿模型提供区分度的MMLU-Pro,现在被指出其评测方法存在偏向性,...
大模型最强架构TTT问世!斯坦福UCSD等5年磨一剑, 一夜推翻Transformer
斯坦福大学、加州大学圣地亚哥分校、加州大学伯克利分校和Meta的研究人员提出了一种名为测试时间训练层(Test-Time-Training layers,TTT)的全新架构,旨在...
73年前,香农已经给大模型发展埋下一颗种子
普林斯顿大学教授承现峻提出,1951年克劳德·香农在贝尔实验室提出的预测下一个单词的问题,成为了当前大语言模型(LLM)的基础。香农在论文中给出了两种估计...
新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对
Claude 3.5 Sonnet是Anthropic公司推出的一款新型大型语言模型,以其卓越的性能和快速、低成本的特点在全球范围内受到关注。在关键指标的比较中,Claude 3.5 ...
LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告
由马里兰大学、OpenAI、斯坦福大学、微软等12所机构的30多名研究者共同完成的一项大规模系统研究,首次深入探讨了大型语言模型(LLM)的提示技术,并发布了一...