大模型

LLM,VLM,模型

芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?AI大牛质疑数据污染

这篇文章报道了一项最新研究,发现大型语言模型(LLM)在分析财务报表和预测公司收益方面的表现超越人类分析师和专业模型。主要内容包括:1. 研究发现,LLM(尤...

MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」

本文介绍了MoE(混合专家)作为一种模块化的稀疏激活技术在大型模型训练中的应用。MoE通过将模型参数划分为多个专家子模块,每个输入仅激活少数相关专家,从...

全球首台生物计算机开放服务:16个人脑类器官,能耗节省百万倍

瑞士初创公司 FinalSpark 发布了一款全球首款生物处理器,称为 Neuroplatform,据称,该处理器比传统数字处理器功耗低百万倍,这一创新技术或可为计算机科技...

对话广联达董事长袁正刚:首款行业AI模型参数量320亿,后续或将公布千亿行业大模型|钛媒体AGI

在中国数字建筑大会2024上,广联达公司发布了具备320亿参数的建筑行业AI大模型AecGPT及配套平台级方案。AecGPT针对建筑行业的七个领域20个细分专家知识域,展...

港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

多模态大模型(MLLM)在视觉任务中展现出强大的认知理解能力,但目前大多数模型局限于单向的图像理解,难以在图像上进行精确定位。这一问题限制了模型在图像...

多位AI大牛被曝离职创业;「国家队」下场,移动、电信发布大模型;谷歌手动删除并回应新AI搜索失误丨AI情报局

连信数字近日完成上亿元A轮融资,资金将用于推动大模型核心能力提升和智能体产品研发。马斯克的人工智能公司xAI计划6月完成新一轮融资,估值可能超240亿美元...

不要被价格战迷乱双眼,大模型竞争的关键在于生态

这篇文章主要讨论了当前大模型领域的价格竞争趋势和产业发展的观点。文章提到,大模型领域的价格战主要是由云厂商间的内卷外溢引起的,而非真正的技术竞争。...

科技动态:哪些AI芯片企业在挑战英伟达

Nvidia在最近一个季度销售额同比增长262%,市值达到了2.62万亿美元,相比之下,整个A股半导体企业合计市值仅为2.59万亿人民币。Nvidia的地位被形容为“谁控制...

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

中国电信人工智能研究院近日推出了业内首个支持30种方言自由混说的语音识别大模型,这是国内支持最多方言的语音识别大模型。该模型可以准确识别和理解粤语、...

Meta等最新研究:多token预测,提升大模型推理效率

在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法需要大量数据且可能降...
1 254 255 256 257 258 451