GPT-GPTs

GPT,GPTs,Prompt

Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发

Meta最新发布的大模型Llama 4在发布后引发了广泛讨论,但其实际表现与预期存在较大差距。尽管Meta官方宣称Llama 4在多个基准测试中取得了优异成绩,例如在大...

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

路由LLM是一种通过智能调度机制动态分配请求到多个候选大语言模型(LLM)的技术范式,旨在通过异构模型的协同增效突破单一模型的性能上限。当前大模型研究面...

用AI把微信聊天记录变成可视化报告,酷到封神。

一个AI自媒体群的聊天记录可视化工具引发了广泛关注。该工具由群友@Simon的精神世界开发,旨在解决群内信息过载的问题。通过三步操作,用户可以将微信聊天记...

反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

Meta生成式AI领导者Ahmad Al-Dahle针对Llama 4开源后的质疑进行了官方回应。Ahmad承认,由于模型在开发完成后立即发布,不同服务中的模型质量存在差异,并承...

微软的「50 岁生日」,过得真不容易

微软在2025年迎来了五十周年生日,尽管面临全球经济波动和内部挑战,这家科技巨头依然展现了其强大的生命力和创新能力。微软的历史充满了戏剧性的转折,从最...

Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?

Meta近日发布了Llama 4系列模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth,宣称这些模型经过大量未标注的文本、图像和视频数据训练,视觉理...

四个维度深入剖析「 Test-Time Scaling 」!首篇系统综述,拆解推理阶段扩展的原理与实战

随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭,推理阶段扩展(Test-Time Scaling, TTS)技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...

Llama 4 详细评测:开源模型的全面倒退?

Meta最新发布的开源大模型Llama 4在技术社区引发了广泛争议。尽管其规格参数堪称“顶配开源”,包括两个混合专家(MoE)架构版本——Scout(109B总参数,17B活跃...

Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅

Meta最新发布的Llama 4本应成为AI领域的焦点,然而却因一系列问题引发了广泛争议。开源首日,Llama 4的代码能力表现极差,甚至不如GPT-4o等现有模型。更令人...

曝OpenAI斥资36亿收购前苹果设计灵魂团队

Sam Altman与Jony Ive联手开发了一款新型AI驱动的个人设备,该项目名为io Products。这款设备被外界期待地称为“AI时代的iPhone”,尽管其设计仍处于初期阶段,...
1 2 3 224