大模型
LLM,VLM,模型
Llama 4 先后被 DeepSeek、英伟达暴击,Meta 不再是大模型开源“霸主”了
英伟达于4月8日发布了最新大语言模型Llama3.1 Nemotron Ultra 253B,该模型基于Meta的Llama-3.1-405B-Instruct构建,并通过神经架构搜索(NAS)技术进行了深...
论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表
alphaXiv最新推出的「Deep Research for arXiv」功能,旨在帮助研究人员更高效地在arXiv平台上进行学术论文的检索与阅读。该功能通过快速生成内容完整、结构...
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
谷歌Deep Research近期迎来了重大升级,搭载了全球顶尖的Gemini 2.5 Pro模型。这一升级在多个方面实现了显著提升,包括分析推理、信息整合和报告洞察力。相较...
AI封神了!无剪辑一次直出60秒《猫和老鼠》片段,全网百万人围观
加州大学伯克利分校、斯坦福大学、英伟达等机构联合制作的《猫和老鼠》AI短片引发了广泛关注。这些短片通过AI技术生成,展现了复杂的故事和动态动作,所有视...
Devin 2.0 登场,AI 软件工程产品价格暴跌,从 500 美元直降至 20 美元!
由Cognition AI开发的Devin 2.0标志着AI驱动的软件开发领域迈入了一个新阶段。作为一款智能体原生软件开发平台,Devin 2.0通过引入一系列新功能,旨在提升开...
大模型不停进步,“杀死”了旧时代的产品经理
生成式大模型的快速发展正在重塑产品经理的角色,尤其是在AI时代,传统的产品经理面临着前所未有的挑战和焦虑。随着大模型能力的快速迭代,产品经理的工作边...
DeepSeek的极致谄媚,正在摧毁我们的判断力。
在与AI的交互中,用户常常会体验到一种过度迎合的现象。当用户提出带有倾向性的问题时,AI往往会顺着用户的意思回答,甚至在用户立场转变时也随之改变。这种...
媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开
今天凌晨4点,著名大模型训练平台Together AI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview。该模型仅有140亿参数,但在知名代码测试平台LiveC...
英伟达开源15T数据集:32万个机器人训练轨迹
英伟达近日开源了其超大训练数据合集——NVIDIA Physical AI Dataset,这一数据集规模达到15T,涵盖了超过320,000个机器人训练轨迹和1,000个通用场景描述,并包...
斯坦福 AI 指数报告发布:2024 年美国 AI 私人投资约为中国的 12 倍、GPT-3.5级别模型推理成本下降 280 倍
斯坦福大学以人为本的人工智能研究所(HAI)发布的《2025年人工智能指数报告》显示,中美在人工智能领域的差距正在显著缩小。报告指出,过去一年中,美国的AI...