标签:gpt-4-32k

DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源

DeepMind最近提交的一篇论文《Long-form factuality in large language models》引发了热议。该论文提出了一种新的方法,可以对大语言模型的长篇事实性进行评...

后汤晓鸥时代的商汤,何去何从?

商汤科技,一家以人工智能技术为核心的公司,近年来在生成式AI技术方面取得了显著的成果。然而,尽管其生成式AI收入实现了飞速增长,但由于其他业务的缩减、...

阿里妈妈怎么做 AI 电商?

2024年,AI电商应用落地迅速,其中阿里妈妈作为阿里商家端服务的出口,其动向备受业内关注。阿里妈妈正式发布【1+1+3】创新业务模型,基于内部自研的AI技术,...

首个基于SSM-Transformer混合架构,开源商业大模型Jamba

AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...

从 Moonshot 崛起看中国大模型:资本其实没有大家想的那么急

月之暗面的崛起得益于资本的轰抢与市场的高度关注。其在短时间内获得多轮投资,一跃跻身于中国大模型初创企业的第一梯队。投资人对月之暗面的期许是“做出 Glo...

谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力

本文主要介绍了谷歌Deepmind和南加州大学研究人员提出的一种用于大语言模型的通用框架——SELF-DISCOVER,它能自行发现任务内在的推理结构,以解决对典型提示方...

钉钉AI:好险,差点就被长文本卷到

钉钉AI助理近期进行了一次重大升级,主要包括长文本处理、多模态速读和自定义工作流三大能力。其中,长文本处理能力使得钉钉AI助理能够轻松处理几十万字的文...

1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX

Databricks,一家著名的数据和AI平台,于3月28日正式开源了其大模型DBRX。DBRX是一个专家混合模型(MoE),拥有1320亿参数,能生成文本/代码、数学推理等,有...

Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4

Claude 3是一款人工智能模型,其在通用任务上的表现已经被全球公认为最强。然而,对于特定的专业领域,比如化学,其表现如何却是一个未知数。化学在药物发现...

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...
1 2 3 4 13