“工作原理”的搜索结果

OpenAI官宣开源Transformer Debugger!不用写代码,人人可以破解LLM黑箱
新智元报道,OpenAI超级对齐团队负责人宣布开源Transformer调试器(TDB),这将使研究人员能够在不编写代码的情况下快速探索大型语言模...
我们与「邪恶GPT」的距离
本文探讨了大型语言模型(LLMs)在推动创新变革的同时,也带来了网络安全和伦理道德方面的挑战。文章首先提出了大型模型可能成为虚假信...
OpenAI联合创始人通俗解读大语言模型
模型信息 【模型公司】 OpenAI 【模型名称】 gpt-4-0125-preview 【摘要评分】 ★★★★★   文章摘要 【关 键 词】 大型语言...
OpenAI王炸模型引爆科技圈,我们第一时间深读了官方技术报告
在2月16日凌晨,OpenAI发布了文生视频大模型Sora,引起了科技圈的震惊和感叹。Sora具有多项强大功能,包括文本到视频生成能力、复杂场景...
ChatGPT有记忆了!OpenAI官宣记忆功能开启测试,奥特曼称GPT-5更智能
OpenAI最近宣布了ChatGPT的一个重要更新,即新增了记忆功能,预计将在下周向部分免费及Plus用户推出。这一功能允许ChatGPT记住用户的对...
三个Agent顶个GPT-4,基于开源小模型的那种|中大阿里联合出品
这篇文章介绍了一个名为α-UMi的多模型协作框架,通过三个小模型:planner、caller和summarizer的协作,实现了比肩GPT-4的工具调用效果。...
LlamaPack | 新手入门
文章主要介绍了LlamaIndex和LlamaPack的概念及其使用方法。LlamaIndex是一个简单、灵活的数据框架,用于将自定义数据源连接到大型语言模...
小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜
这篇文章介绍了一种名为InstantID的图像生成技术,它能够通过上传一张照片,即刻生成多种风格的AI写真。这项技术由小红书的95后团队Inst...
聊聊我构建SMoE模型的过程
文章首先介绍了稀疏混合专家语言模型的背景和相关概念,以及与传统 Transformer 模型的共享元素。作者指出训练稳定性是这些模型面临的主...
2023年大语言模型融合技术调研与实践指南
本文介绍了大语言模型融合的新技术,包括模型合并算法、实践和配置示例。首先介绍了模型合并的流行趋势和效果,以及在OpenLLM排行榜上产...
1 4 5 6 7