大模型

LLM,VLM,模型

招生信息 | 英国莱斯特大学举雅琨老师招收博士生了!

举雅琨博士自2024年起任职于英国莱斯特大学计算机与数学科学学院,担任助理教授。他长期致力于计算机视觉与图像处理领域的研究,尤其在三维重建、光度立体、...

单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

智源研究院近日发布了新一代超长视频理解模型Video-XL-2,该模型在长视频理解任务中表现出色,显著提升了多模态大模型对长视频内容的理解能力。Video-XL-2在M...

训练MoE足足提速70%!华为只用了3招

MoE(混合专家)模型在扩展模型能力方面具有显著优势,但其训练过程中面临效率不足和资源分配不均的挑战。华为通过构建Adaptive Pipe & EDPB优化方案,解决了...

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

长视频理解作为多模态大模型的关键能力之一,尽管OpenAI GPT-4o和Google Gemini等私有模型已取得显著进展,但开源模型在效果、计算开销和运行效率等方面仍存...

用DeepSeek徒手造一个能对话的AI简历,助你当场拿下Offer。

在招聘过程中,许多求职者提交的简历都充斥着与AI相关的经历,甚至有些简历是由AI生成的。这些简历通常包含诸如“掌握全链路工作流”、“独立搭建xx系统”等夸张...

免费使用Sora!微软发布Bing Video Creator

微软今日凌晨发布了Bing搜索引擎的全新功能——Bing Video Creator,该功能由OpenAI的文生视频模型Sora提供技术支持。通过自然语言输入,用户可以生成各种类型...

暌违六年、互联网女皇340页AI报告刷屏:AI「太空竞赛」开启,下一个10亿用户市场机会来了!

Mary Meeker,被誉为“互联网女皇”,在沉寂数年后携一份340页的《AI趋势报告2025》重返公众视野。这份报告在科技界引发了广泛关注,尤其是其核心观点:AI驱动...

微软等提出「模型链」新范式,与Transformer性能相当,扩展性灵活性更好

随着大语言模型(LLM)的快速发展,扩展Transformer架构已成为推动人工智能领域进步的关键途径。然而,LLM参数规模的指数级增长带来了高昂的训练成本和推理效...

无需人工标注!AI自生成训练数据,靠「演绎-归纳-溯因」解锁推理能力

新加坡国立大学、清华大学和Salesforce AI Research的研究者提出了一种名为“元能力对齐”的训练框架,旨在提升大型推理模型在数学、编程和科学问题上的基本推...

首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升

西北大学与Google、谷歌DeepMind团队提出了一种新的强化学习方法——贝叶斯自适应强化学习(BARL),旨在解决传统强化学习(RL)在反思探索方面的局限性。传统R...
1 2 3 4 602