标签:性能评估
IBM推出化学大模型:可精准预测分子性质和行为
在化学领域,IBM研究人员开发了一款名为SMI-TED的大模型,专为化学领域设计,拥有2.89亿参数。该模型在PubChem数据库上的9100万个分子数据集上进行预训练,相...
仅4个多月RAG就进化到“一个新时代”了:成本降低到GraphRAG的0.1%
微软最近推出了LazyGraphRAG,这是一种新型的RAG(检索增强生成)系统,旨在以高效且低成本的方式实现图形RAG功能。LazyGraphRAG结合了VectorRAG和GraphRAG的...
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
Ai2联合华盛顿大学及Meta、CMU、斯坦福等机构发布了OpenScholar系统,这是一个检索增强型语言模型,旨在辅助科学家进行文献搜索和综述工作。该系统结合了一个...
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控:GUI智能体的黎明
新加坡国立大学的研究团队对AI系统Claude进行了全面测试,发现其在20多个场景下展现出强大的电脑操控能力。在游戏领域,Claude能够自动完成《崩坏:星穹铁道...
《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源
在Sebastian Raschka的长文中,他详细阐述了如何将预训练的大型语言模型(LLM)转化为文本分类器。文章首先强调了文本分类在商业应用中的重要性,如垃圾邮件...
麻省理工创新模型:用2D视频扩散,生成 3D 视频
在传统的3D视频生成领域,存在两种主要方法:一种是依赖2D视频模型和静态3D场景模型的分类器来优化动态3D视频场景的表示,这种方法对计算资源的需求极高,生...
MUMU:用文本、图像引导,多模态图像生成模型
AIGC领域的专业社区专注于微软、OpenAI、百度文心一言、讯飞星火等大型语言模型(LLM)的发展和应用落地,致力于LLM的市场研究和AIGC开发者生态建设。在图像...
怎么构建Agent?我写了一个教程(含代码)
本文探讨了利用多个AI Agent(智能体)协同工作以提高效率和成果质量的系统构建方法。文章首先强调了团队合作的重要性,认为通过分工合作,每个成员专注于自...
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
阿布扎比技术创新研究所(TII)发布了一款名为Falcon Mamba 7B的新型开源Mamba架构模型,该模型自2023年12月首次推出以来,已成为Transformer模型的有力竞争...
苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo
苹果推出了深度集成于iOS 18、iPadOS 18和macOS Sequoia的全新个性化智能系统——Apple Intelligence。该系统包含两种基础模型:一款拥有约30亿参数的设备端语...