标签:大语言模型
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的“逆转诅咒”问题,即模型无法理解“如果A是B,则B是A”的逻辑关系,已经被Meta FAIR的研究人员通过一种新的反向训练方法得到改进。这个问题最初在去...
OpenAI曾转录100万小时视频数据,训练GPT-4
随着人工智能技术的飞速发展,大语言模型(LLM)已成为科技巨头们争夺的新战场。专注于AIGC领域的专业社区密切关注着微软 & OpenAI、百度文心一言、讯飞星火...
亚马逊线下店 AI 训练失败:离不开 1000 名审核人员
亚马逊的“拿货即走”技术,一度被视为零售业的一大创新,旨在通过AI视频监控系统实现无需收银员的购物体验。然而,这项技术并未达到预期效果,导致亚马逊不得...
“弱智贴吧”的数据,居然是最强中文语料库
随着人工智能的快速发展,大语言模型(LLM)在多个领域的应用变得越来越广泛。专注于AIGC领域的专业社区特别关注了微软 & OpenAI、百度文心一言、讯飞星火等...
Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数
近年来,人工智能生成内容(AIGC)领域迅速发展,特别是大语言模型(LLM)的进步引起了广泛关注。4月5日,Cohere这家专注于类ChatGPT平台的公司发布了一款名...
OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!
OpenAI近期宣布了针对其大语言模型(LLM)的6个全新微调API功能,这些功能旨在帮助企业和开发人员构建更加特定领域和精细化的ChatGPT应用。这些新增功能包括...
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍
机器之心专栏近期介绍了一种基于频域的大语言模型架构——帝江,这一架构旨在解决现有大型Transformer模型在推理成本和训练成本上的问题。帝江模型通过频域自注...
开源大模型AI代理操作系统:像Windos一样,操控AI代理
内存管理器则负责管理短期内存资源,为AI代理提供高效的临时存储。它确保了内存资源的高效利用,并通过访问管理器实现不同代理之间的内存隔离。未来,AIOS计...
文本直接生成2分钟视频,即将开源模型StreamingT2V
文章摘要 【关 键 词】 AIGC、大语言模型、视频生成、技术创新、StreamingT2V 近年来,人工智能生成内容(AIGC)领域取得了显著进展,特别是在大...
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind最近提交的一篇论文《Long-form factuality in large language models》引发了热议。该论文提出了一种新的方法,可以对大语言模型的长篇事实性进行评...