标签:性能评估

《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源

在Sebastian Raschka的长文中,他详细阐述了如何将预训练的大型语言模型(LLM)转化为文本分类器。文章首先强调了文本分类在商业应用中的重要性,如垃圾邮件...

麻省理工创新模型:用2D视频扩散,生成 3D 视频

在传统的3D视频生成领域,存在两种主要方法:一种是依赖2D视频模型和静态3D场景模型的分类器来优化动态3D视频场景的表示,这种方法对计算资源的需求极高,生...

MUMU:用文本、图像引导,多模态图像生成模型

AIGC领域的专业社区专注于微软、OpenAI、百度文心一言、讯飞星火等大型语言模型(LLM)的发展和应用落地,致力于LLM的市场研究和AIGC开发者生态建设。在图像...

怎么构建Agent?我写了一个教程(含代码)

本文探讨了利用多个AI Agent(智能体)协同工作以提高效率和成果质量的系统构建方法。文章首先强调了团队合作的重要性,认为通过分工合作,每个成员专注于自...

非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1

阿布扎比技术创新研究所(TII)发布了一款名为Falcon Mamba 7B的新型开源Mamba架构模型,该模型自2023年12月首次推出以来,已成为Transformer模型的有力竞争...

苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo

苹果推出了深度集成于iOS 18、iPadOS 18和macOS Sequoia的全新个性化智能系统——Apple Intelligence。该系统包含两种基础模型:一款拥有约30亿参数的设备端语...

英伟达新研究:上下文长度虚标严重,32K性能合格的都不多

研究人员近日针对大型语言模型处理长文本的能力进行了深入探讨,并提出了名为RULER的新基准测试。该测试包含四大类共13项任务,旨在评估模型的“有效上下文”长...

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

近期研究表明,通过训练纯解码器生成模型,可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇扩展方法实现多模态表...

全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

为使大型语言模型(LLM)与人类价值观和意图保持一致,学习人类反馈是关键。近期研究提出了一种简单有效的离线偏好优化算法——SimPO。SimPO的核心优势在于其奖...

Meta发布多模态模型Chameleon:34B、类GPT-4o、性能接近GPT-4V

在多模态人工智能领域,GPT-4o 的问世开创了一个新纪元,被称为首个“原生”多模态模型,因其能无缝融合文本、视觉和音频。区别于传统多模态模型采用的特定模态...
1 2