大模型
LLM,VLM,模型
用国考题来测试“百小应”和 GPT-4o,到底谁能成功上岸?|AI鲜测
百川智能发布了Baichuan 4大模型,并推出了首款AI搜索助手“百小应”。这款助手在知识百科、长文本、生成创作等文科类中文任务上表现优于国外大模型。通过对“百...
雷军造车可一点不耽误小米赚钱
整体营收达到755.1亿元人民币,同比增长27%,净利润65亿元,同比增长超过100%。一季度研发投入达52亿元,同比增长25.4%,主要投入于智能汽车业务及创新业务。...
质疑、卖身、价格战,AI 竟遭遇人类“围剿”?|钛媒体AGI
近年来,生成式人工智能(AI)技术备受关注,然而其问题也日益凸显。近期研究显示,ChatGPT对Stack Overflow上代码开发问题的回答中有52%包含错误信息,77%过于...
中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o
在中国移动人工智能生态大会主旨论坛上,中国移动发布了自研的「九天」千亿多模态基座大模型。这一模型被誉为国内最值得信赖、最懂行业的全栈大模型,旨在为...
Bengio等人新作:注意力可被视为RNN,新模型媲美Transformer,但超级省内存
在近期的研究中,加拿大皇家银行 AI 研究所 Borealis AI 与蒙特利尔大学的研究者提出了一种新型序列建模方法,该方法旨在解决 Transformer 模型在推理时内存...
如何落地AI编程和可观测智能化?怎么从 0 到 1 训练大模型?阿里多位专家出席 ArchSummit 现身说法
麦肯锡研究表明,生成式人工智能(AI)在软件开发中能显著提升效率,如将代码文档生成时间缩短一半,新代码生成效率加倍,以及将代码重构任务的耗时减少1/3。...
大模型“国家队”发力了 ,中国移动发布“万百千”
中国移动自研的全栈国产化生态大模型“九天智能基座”已正式发布,该模型包括万卡算力、千亿参数模型及百汇平台三部分。在算力方面,中国移动计划建立智算网络...
披萨上涂胶水、建议用户吃石头、毒蘑菇……谷歌又被大模型带沟里
谷歌的AI Overview功能近期因其生成的不准确、甚至有害的回答而在社交媒体上引发争议。这项功能旨在通过人工智能技术在搜索结果顶部提供答案,但一些用户发现...
AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征
Anthropic团队在理解人工智能模型内部运作机制方面取得了突破性进展。他们首次详细表征了大型语言模型Claude Sonnet中的数百万个概念,这一成果具有里程碑意...
李飞飞:大模型当前不存在主观感觉能力,多少亿参数都不行
他们认为,尽管大型语言模型(LLM)在文本生成和其他任务上表现出超人类的能力,但这并不意味着它们拥有感觉。她用深蓝超级计算机作为例子,说明即使它能在棋...