标签:大语言模型

中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹

面壁智能,一家源自清华大学的创业公司,近期在大语言模型领域取得了显著进展。该公司致力于优化语言模型,以提高效率并降低成本。今年2月,面壁智能发布了第...

超越GPT-4V,苹果多模态大模型上新!

苹果发布了最新的多模态大语言模型(MLLM)Ferret-UI,该模型在理解和与屏幕信息交互方面表现出卓越性能,超越了GPT-4V。Ferret-UI专为理解移动UI屏幕而设计...

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

在近期的研究中,斯坦福助理教授杨笛一及其团队提出了利用大语言模型(LLM)来训练社交技能的新方法。这项研究认为,通过大语言模型的帮助,社交技能训练可以...

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的“逆转诅咒”问题,即模型无法理解“如果A是B,则B是A”的逻辑关系,已经被Meta FAIR的研究人员通过一种新的反向训练方法得到改进。这个问题最初在去...

OpenAI曾转录100万小时视频数据,训练GPT-4

随着人工智能技术的飞速发展,大语言模型(LLM)已成为科技巨头们争夺的新战场。专注于AIGC领域的专业社区密切关注着微软 & OpenAI、百度文心一言、讯飞星火...

亚马逊线下店 AI 训练失败:离不开 1000 名审核人员

亚马逊的“拿货即走”技术,一度被视为零售业的一大创新,旨在通过AI视频监控系统实现无需收银员的购物体验。然而,这项技术并未达到预期效果,导致亚马逊不得...

“弱智贴吧”的数据,居然是最强中文语料库

随着人工智能的快速发展,大语言模型(LLM)在多个领域的应用变得越来越广泛。专注于AIGC领域的专业社区特别关注了微软 & OpenAI、百度文心一言、讯飞星火等...

Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数

近年来,人工智能生成内容(AIGC)领域迅速发展,特别是大语言模型(LLM)的进步引起了广泛关注。4月5日,Cohere这家专注于类ChatGPT平台的公司发布了一款名...

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI近期宣布了针对其大语言模型(LLM)的6个全新微调API功能,这些功能旨在帮助企业和开发人员构建更加特定领域和精细化的ChatGPT应用。这些新增功能包括...

华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

机器之心专栏近期介绍了一种基于频域的大语言模型架构——帝江,这一架构旨在解决现有大型Transformer模型在推理成本和训练成本上的问题。帝江模型通过频域自注...
1 2 3 4 5 6 9