大模型

LLM,VLM,模型

重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练

过去几年,基于人类偏好的强化学习(RLHF)成为大语言模型(LLM)后训练阶段的关键技术,显著提升了模型的对齐能力,并拓展了其在推理增强、智能体交互等场景...

提示词工程、RAG之后,LangChain:上下文工程开始火了!

随着技术的不断优化,更多情况下(尤其是当模型变得更强大时)模型的错误是由传递的上下文不当造成的。传递给模型的上下文可能由于缺少上下文或上下文格式不...

小米小爱同学:资源受限下,实现端侧大模型的高性能推理

随着大模型能力的持续提升,端侧设备部署成为产业界的重要工程挑战。手机、车载、IoT等设备对模型体积、推理时延、功耗和更新机制提出了极高要求,使得端侧推...

Windows最新搭载微软自研模型Mu,一句话搞定所有系统配置

此外,Copilot+PC还为AI照片、画图等编辑工具引入新功能。例如,Photos relight只需单击选择喜欢的内置灯光预设,就可以为照片添加创意效果。微软还为Paint应...

Agent落地的“光刻机之问”:当全行业紧盯“大脑”,谁在打造真正的基石?

当下AI Agent领域呈现出理论与实践的显著脱节:尽管学术界热衷于探讨Agent的智能极限,但实际应用中却普遍面临从实验室到生产环境落地时的性能衰退问题。这一...

22年前的一篇报告,预言了今天的CPU

在2003年,计算机架构师迈克尔·J·弗林(Michael J. Flynn)提出了一个关于计算未来的重要警告。他指出,CPU的复杂化趋势——如推测执行、深度流水线和臃肿的指...

哈工大发布动画多智能体,文本一键生成连贯动画

随着大规模多模态模型的兴起,AI技术在生成叙事性视频方面的应用成为研究热点。现有的方法,如MINT Video和TTT-Video,虽然在生成单个视频片段时质量有所提升...

Cache Me If You Can:陈丹琦团队如何「抓住」关键缓存,解放LLM内存?

普林斯顿大学陈丹琦团队提出统一框架解决长上下文语言模型中的KV缓存内存瓶颈问题。随着'长思维链'等技术的兴起,模型需要处理数万token的输入,导致基于Tran...

讲得了课、押得中题、学习规划还能量身定制,真卷到点子上的只有它

讯飞星火大模型X1在高考测试中表现卓越,语文作文、数学和英语分别获得国产AI中的高分排名。该模型作为科大讯飞推出的深度推理大模型,不仅支持多模态教学功...

多模态AI黑马刷榜后再造神器:一个产品搞定图片视频播客生成,自带百种特效,大牛梅涛团队出品

智象未来推出的vivago2.0是一款集成了多模态AI能力的全能创作工具,由加拿大工程院院士梅涛领衔的团队开发。该工具整合了文生图、图生视频、AI播客、特效模板...
1 21 22 23 24 25 366