标签:语言模型
苹果大模型最新论文:AFM 模型多维度评测「出炉」
苹果公司在全球开发者大会(WWDC)上推出了最新的个人智能系统Apple Intelligence,该系统能够深度集成到iOS 18、iPadOS 18和macOS Sequoia中。苹果在2024年...
Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o!
7月23日凌晨,Meta的新版大型语言模型(LLM)Llama 3.1 405B在4chan上泄露,并在多数基准测试中击败了GPT-4o。据悉,Meta可能很快正式发布Llama 3系列中最大...
提示词用上“过去式“,秒破GPT4o等六大模型安全限制!中文语境也好使
洛桑联邦理工学院的最新研究揭示了大型语言模型在安全措施上的一个新漏洞。研究发现,通过将请求中的时间设置为过去时态,可以显著提高对GPT-4o模型的攻击成...
大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待
MMLU-Pro,一个旨在衡量大型语言模型性能的权威测试,近期遭遇了信任危机。原本被认为能为前沿模型提供区分度的MMLU-Pro,现在被指出其评测方法存在偏向性,...
大模型最强架构TTT问世!斯坦福UCSD等5年磨一剑, 一夜推翻Transformer
斯坦福大学、加州大学圣地亚哥分校、加州大学伯克利分校和Meta的研究人员提出了一种名为测试时间训练层(Test-Time-Training layers,TTT)的全新架构,旨在...
73年前,香农已经给大模型发展埋下一颗种子
普林斯顿大学教授承现峻提出,1951年克劳德·香农在贝尔实验室提出的预测下一个单词的问题,成为了当前大语言模型(LLM)的基础。香农在论文中给出了两种估计...
新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对
Claude 3.5 Sonnet是Anthropic公司推出的一款新型大型语言模型,以其卓越的性能和快速、低成本的特点在全球范围内受到关注。在关键指标的比较中,Claude 3.5 ...
LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告
由马里兰大学、OpenAI、斯坦福大学、微软等12所机构的30多名研究者共同完成的一项大规模系统研究,首次深入探讨了大型语言模型(LLM)的提示技术,并发布了一...
ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
最近,一篇入选ACL 2024的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体上引发了广泛讨论。该论文探讨了当前语言模型是否可...
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神
北大、UC伯克利和斯坦福的研究人员针对大型语言模型(LLM)在推理任务上的不足,提出了一种名为“思维缓冲区”(Buffer of Thoughts,简称BoT)的新方法。该方...