标签:大模型

AI进化太快了!MIT和斯坦福已经让它自己设计Harness

在三大核心测试领域,Meta-Harness均取得显著领先。 在在线文本分类任务中,其自动发现的架构以48.6%的平均准确率大幅超越ACE和MCE等人工方案,并将上下文消...

当心!腾讯、字节等揭示,OpenClaw有无法修复的安全死结

面向未来的个人伴侣智能体预计将接管包括邮件整理在内的诸多数字生命活动,但随着部署范围扩展相关安全议题愈发紧迫。加州大学等科研团队联合发布研究报告针...

PTC、西门子、SAP,都在抢跑这个赛道

在全球供应链动态调整、地缘政治压力与技术爆发三重重击下,制造业正经历深度转型,服务化制造与智能产品全生命周期成为必由之路。工业人工智能已进入应用落...

Claude神之bug:给自己下指令,还诬赖用户??Hacker News炸了

网络安全社区近期因某知名模型的身份识别缺陷而受到震动。多名技术人员反映,当输入中包含特殊截断字符时,AI 会混淆指令来源,将外界注入的风险请求误判为用...

美团之后,京东也开始自研大模型了

研发团队为了保证学习效果专门建立了详尽的高质量数据管道。在处理公开网络资讯时加入特定的查重与隐私保护模块,并利用微调小模型去除广告杂项。大模型能有...

Karpathy强推,大厂抢着「复古」命令行,Star数全都上千了

近期飞书、钉钉与企业微信在短时间内相继推出 CLI 工具,引发了企业软件对交互模式的新一轮思考,预示着 AI 生态格局面临深刻重塑。命令行界面在此刻的价值体...

Karpathy知识库「LLM Wiki」火爆了,全网围观讨论

系统架构被清晰划分为底层原始数据源、中间生成的维基文档集以及顶层控制工作流的指令规范这三类层级。原始的素材文件始终保持固定以确保真实性,而核心文档...

“AI预测未来”!碾压马斯克Grok-4!国产 AI登顶全球

新式评测摒弃了开放书籍模式,转而每日实时更新来自 195 个全球信源的未知考题。为了消除偶然性导致的虚假繁荣,系统采用了高度差异化的分值结构,其中考查高...

大模型SFT后效果≠RL潜力!港科大、阿里提出自适应冷启动新范式

近年来,强化学习逐步确立为大语言模型后训练的核心领域。虽然有大量实证表明该路径能有效激发模型的复杂推理能力,但在实际操作中直接把普通模型投入使用极...

阿里3天3王炸!全模态、精准控图和智能体编程SOTA,但没开源

阿里巴巴在近三天的时间跨度里密集发布三款战略级人工智能模型,确立了在大模型技术与行业应用中的前沿地位。此次亮相的核心产品涵盖通义千问全域版本、万相...
1 2 3 80