大模型
LLM,VLM,模型
基础模型、长文本、数据库、应用落地……一篇文章读懂今天大模型行业的关键问题丨2024 GDC
2024年全球开发者先锋大会(GDC)在上海成功举办,聚集了众多国内外人工智能领域的前沿创业者和技术专家。本次大会由上海市人工智能行业协会(SAIA)主办,旨...
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind最近提交的一篇论文《Long-form factuality in large language models》引发了热议。该论文提出了一种新的方法,可以对大语言模型的长篇事实性进行评...
阿里妈妈怎么做 AI 电商?
2024年,AI电商应用落地迅速,其中阿里妈妈作为阿里商家端服务的出口,其动向备受业内关注。阿里妈妈正式发布【1+1+3】创新业务模型,基于内部自研的AI技术,...
首个基于SSM-Transformer混合架构,开源商业大模型Jamba
AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...
从 Moonshot 崛起看中国大模型:资本其实没有大家想的那么急
月之暗面的崛起得益于资本的轰抢与市场的高度关注。其在短时间内获得多轮投资,一跃跻身于中国大模型初创企业的第一梯队。投资人对月之暗面的期许是“做出 Glo...
对话武汉大学李淼教授:以大模型视角看待一切机器人问题|GAIR live
武汉大学的李淼教授在机器人学习和控制、物体抓取和操作等领域的研究方面取得了显著成就。他曾在瑞士洛桑联邦理工学院攻读博士学位,并因其关于动态抓取算法...
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
本文主要介绍了谷歌Deepmind和南加州大学研究人员提出的一种用于大语言模型的通用框架——SELF-DISCOVER,它能自行发现任务内在的推理结构,以解决对典型提示方...
钉钉AI:好险,差点就被长文本卷到
钉钉AI助理近期进行了一次重大升级,主要包括长文本处理、多模态速读和自定义工作流三大能力。其中,长文本处理能力使得钉钉AI助理能够轻松处理几十万字的文...
1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX
Databricks,一家著名的数据和AI平台,于3月28日正式开源了其大模型DBRX。DBRX是一个专家混合模型(MoE),拥有1320亿参数,能生成文本/代码、数学推理等,有...
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
Claude 3是一款人工智能模型,其在通用任务上的表现已经被全球公认为最强。然而,对于特定的专业领域,比如化学,其表现如何却是一个未知数。化学在药物发现...