大模型
LLM,VLM,模型
用AI把微信聊天记录变成可视化报告,酷到封神。
一个AI自媒体群的聊天记录可视化工具引发了广泛关注。该工具由群友@Simon的精神世界开发,旨在解决群内信息过载的问题。通过三步操作,用户可以将微信聊天记...
反击DeepSeek失败!Llama 4效果不好,Meta承认有问题
Meta生成式AI领导者Ahmad Al-Dahle针对Llama 4开源后的质疑进行了官方回应。Ahmad承认,由于模型在开发完成后立即发布,不同服务中的模型质量存在差异,并承...
阿里开源R1-Omni,多模态情感识别
阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni,该模型首次将强化学习与可验证奖励(RLVR)应用于多模态大模型,显著提升了情感识别任务中的...
OpenAI 发布大模型现实世界软件工程基准测试 SWE-Lancer
OpenAI 最近发布了 SWE-Lancer 基准测试,旨在评估大语言模型在现实世界自由职业软件工程任务中的表现。该基准测试的数据集包含来自 Upwork 的 1400 多个任务...
击败 Manus?前百度 AI 高管创业1年多,放弃500 万用户搜索产品,转推“最强 Agent ”,自述 9 个月研发历程
总部位于美国加州帕洛阿尔托的初创公司 MainFunc 近日发布了 Genspark Super Agent,这是一款能够自主思考、计划、行动并使用工具来处理复杂任务的 AI 代理系...
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
Meta近日发布了Llama 4系列模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth,宣称这些模型经过大量未标注的文本、图像和视频数据训练,视觉理...
AI PPT赛道,为什么Tome失败了,Gamma 却越活越好?
Tome,一家曾经在AI驱动演示工具领域占据领先地位的公司,宣布将在四月底关闭其核心功能Tome Slides,并转型至销售领域。这一决定标志着其在AI演示工具领域的...
四个维度深入剖析「 Test-Time Scaling 」!首篇系统综述,拆解推理阶段扩展的原理与实战
随着大模型训练成本的急剧攀升和优质数据的逐渐枯竭,推理阶段扩展(Test-Time Scaling, TTS)技术迅速成为后预训练时代的关键突破口。与传统的“堆数据、堆参...
Llama 4 详细评测:开源模型的全面倒退?
Meta最新发布的开源大模型Llama 4在技术社区引发了广泛争议。尽管其规格参数堪称“顶配开源”,包括两个混合专家(MoE)架构版本——Scout(109B总参数,17B活跃...
反向传播、前向传播都不要,这种无梯度学习方法是Hinton想要的吗?
反向传播作为深度学习的主流方法,近年来因其生物学不合理性、内存消耗大以及并行计算受限等问题,逐渐受到质疑。Geoffrey Hinton等人一直致力于寻找替代方案...