大模型

LLM,VLM,模型

“跑路”争议之外,Manus这半年产品做怎么样了

2025年初,AI行业的风向发生了变化,从聊天机器人转向了能够直接执行任务的AI Agent。在这一背景下,Manus产品迅速吸引了全球科技圈的关注。Manus的核心目标...

阿里达摩院开源多模态医学大模型—灵枢

大模型在医疗领域的应用面临三大主要难题:医疗知识覆盖不足、幻觉风险高以及推理能力欠缺。为了解决这些问题,阿里巴巴达摩院的研究团队开源了统一多模态医...

实测Vidu Q1参考生功能,看到诸葛亮丘吉尔拿破仑在长城拍照留念

生数科技旗下的AI视频模型Vidu Q1推出了参考生功能,极大地简化了传统内容生产的流程,真正实现了“一个人就是一个剧组”的愿景。通过上传人物、道具、场景等参...

AI们数不清六根手指,这事没那么简单。

在Grok4发布后,作者在社交媒体上发现了一个有趣的帖子,内容涉及AI模型在识别图像时出现的错误。作者测试了多个多模态模型,包括OpenAI o3、o3 pro、豆包、k...

马斯克吹牛了吗?Grok 4第一波实测出炉:既能完虐o3,也菜到数不清6根手指

马斯克在Grok 4发布会上宣布,该模型在所有学科上已达到博士后水平,并可能在今年内实现科学新发现。这一声明引发了全球网友的兴趣,尽管价格高昂,许多人仍...

腾讯AI Lab 提出解耦推理新框架,破解IMO 数学难题

近年来,大语言模型(LLM)在数学推理领域取得了显著进展,但在形式化数学证明方面却遇到了瓶颈。尽管LLM能够以超过80%的准确率生成非形式化的解题思路,但在...

MCP协议曝出大漏洞:会泄露整个数据库

最新研究揭示了MCP协议存在重大漏洞,攻击者可以利用大语言模型(LLM)的指令/数据混淆漏洞直接访问数据库。MCP协议作为智能体领域的行业标准,广泛应用于连...

奖励模型终于迎来预训练新时代!上海AI Lab、复旦POLAR,开启Scaling新范式

在大语言模型的后训练阶段,强化学习是提升模型能力、对齐人类偏好的核心方法,但奖励模型的设计与训练仍是关键瓶颈。当前主流方法包括“基于偏好的奖励建模”...

赵晓卉,你老板知道你用飞书AI爆改绩效评价吗?

飞书的多维表格和知识问答功能在2025飞书未来无限大会中得到了显著升级,展示了其在企业应用中的强大潜力。赵晓卉通过飞书的“超级AI版Excel”爆改了自己的绩效...

马斯克20万GPU训出史上最聪明AI,Grok 4重返地球之巅!人类博士全线溃败

Grok 4的发布标志着xAI在人工智能领域的一次重大突破。这一最新模型在多项基准测试中表现卓越,尤其在HLE(人类最后考试)中展现出博士级别的能力,能够解决...
1 22 23 24 25 26 379