标签:Azure
马化腾的“灯泡”什么时候拿出来
腾讯在最近的财报发布后的交流会上透露,其混元模型已经是一个万亿级别参数的MOE架构模型,其中文表现在全球大语言模型中处于领先水平。腾讯的2023年第四季度...
Anthropic找到了打败OpenAI的方法:自己也成为OpenAI
近期,Anthropic公司因其开发的人工智能模型Claude 3在Chatbot Arena排行榜上击败GPT-4,首次登上王位,引发了业界的广泛关注。亚马逊也对Anthropic进行了再...
AI创业吧!不缺计算资源那种
近年来,AI技术创业已经进入应用层,甚至开始快速迭代。阿里云创业者计划在此背景下应运而生,为创业者提供了技术、成本、场景、商业化等各个环节的解决方案...
马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!
马斯克最新发布的人工智能模型Grok-1.5,以其卓越的编码与数学处理能力、深入的上下文理解以及精准的长文本检索能力,引起了业界的广泛关注。Grok-1.5是Grok...
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
本文主要讨论了半导体技术的发展对AI技术的推动作用,以及未来半导体技术的发展趋势。文章首先提到,过去25年,半导体工艺制程不断逼近极限,才有了ChatGPT的...
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind最近提交的一篇论文《Long-form factuality in large language models》引发了热议。该论文提出了一种新的方法,可以对大语言模型的长篇事实性进行评...
后汤晓鸥时代的商汤,何去何从?
商汤科技,一家以人工智能技术为核心的公司,近年来在生成式AI技术方面取得了显著的成果。然而,尽管其生成式AI收入实现了飞速增长,但由于其他业务的缩减、...
阿里妈妈怎么做 AI 电商?
2024年,AI电商应用落地迅速,其中阿里妈妈作为阿里商家端服务的出口,其动向备受业内关注。阿里妈妈正式发布【1+1+3】创新业务模型,基于内部自研的AI技术,...
首个基于SSM-Transformer混合架构,开源商业大模型Jamba
AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...
从 Moonshot 崛起看中国大模型:资本其实没有大家想的那么急
月之暗面的崛起得益于资本的轰抢与市场的高度关注。其在短时间内获得多轮投资,一跃跻身于中国大模型初创企业的第一梯队。投资人对月之暗面的期许是“做出 Glo...