“微调策略”的搜索结果

LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V
LeCun和谢赛宁团队近日推出了Cambrian-1,一种采用以视觉为中心方法设计的多模态大语言模型(MLLM),并全面开源了模型权重、代码、数据...
六位一线AI工程师总结爆火!大模型应用摸爬滚打一年心得公开,网友:全程高能
在本文中,作者们分享了自己在大模型应用开发过程中的心得和经验。主要观点包括:1. 提示词使用技巧:提示词设计应该简洁明了,避免过于...
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
上海交通大学与上海AI实验室合作提出了一种新的框架——Long-CLIP,旨在解决CLIP模型在处理长文本时的不足。CLIP模型通过对齐视觉和文本模...
AI图片橡皮擦来了,清华&阿里合作推出「概念半透膜」模型,还能改头换面
清华大学丁贵广教授团队和阿里安全联合发布了概念半透膜模型(SPM模型),该模型可以在AI作图模型中精准、可控地擦除各类具象或抽象概念...
AI x 机器人爆发年!英伟达Jim Fan领衔登月任务,谷歌DeepMind新技术曝光
摘要:AI与机器人技术的结合正在成为时代的新风口。谷歌DeepMind和英伟达等AI巨头在机器人领域取得了新的进展。Jim Fan与Yuke Zhu合作创...
大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一
Medusa 的核心在于它的解码头和树注意力机制。解码头可以与原始模型一起训练,而树注意力机制则能够同时处理多个候选者。研究者提出了两...