大模型
LLM,VLM,模型
战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类
斯坦福大学的研究团队在一项为期一年的大规模实验中,对大型语言模型(LLMs)在科学研究创意生成方面的能力进行了评估。研究结果表明,LLMs在产生新颖想法方...
o1突发内幕曝光?谷歌8月论文已揭示原理,大模型光有软件不存在护城河
谷歌DeepMind的一篇论文揭示了一种新的计算策略,该策略与OpenAI的o1模型的工作方式几乎一致。这项研究指出,在测试时增加计算比扩展模型参数更有效,这使得...
微软Office全家桶再爆办公革命,o1模型加持重塑十亿人工作流!1句话生成PPT+自定义智能体
微软在Copilot第二弹发布会上宣布了Office办公全家桶的重磅升级,标志着AI时代下全新工作流的开启。此次升级的核心亮点包括:1. Copilot Pages:这是一个集成...
腾讯推出首个游戏大模型,能生成《巫师3》、《对马岛之魂》等3A巨作!
腾讯公司推出了一款名为GameGen-O的新型大模型,专门针对3A级开放世界游戏的生成。该模型能够模拟包括《巫师3》、《赛博朋克2077》、《对马岛之魂》、《荒野...
o1基石论文火爆传阅,Ilya仍是关键先生!核心项目清北校友闪光
在AI领域,Ilya Sutskever的名字因与OpenAI的o1项目相关而备受关注。他合著的论文《Let’s Verify Step by Step》探讨了提升大语言模型多步推理能力的方法,比...
刚刚,CVPR 2025新规来了:审稿进入「半实名制」,不负责任的审稿人将被标记并拒稿
计算机视觉领域的顶级学术会议CVPR近年来投稿数量激增,从2020年到2023年,年投稿量以约1000篇的速度增长,2024年投稿数首次超过一万篇。这一增长速度远超201...
一文读懂「腾讯云智算」:AI原生时代,我们需怎样的基础设施?
2024年9月6日,腾讯全球数字生态大会圆满结束,大会主题聚焦于AI和云计算等前沿技术的新机遇。在首日的主论坛上,腾讯推出了三项重要产品:MoE模型腾讯混元Tu...
超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99.8%选手
在新智元报道中,加州大学欧文分校(UCI)的物理学博士Kyle Kabasares对OpenAI的o1模型进行了测试,结果令人震惊。Kabasares发现,他花费一年时间编写的博士...
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
新智元报道了多模态大型语言模型(MLLMs)在多学科多模态理解和推理(MMMU)基准测试中的最新进展。尽管这些模型在排行榜上的表现不断提升,但对其是否真正理...
OpenAI o1智商120,还是被陶哲轩称为「平庸的研究生」,但实力究竟如何?
OpenAI最近发布的新模型o1在AI领域引起了广泛关注。该模型在不同的测试中表现出了不同的能力。在智商测试中,o1的得分高达120,超过了其他大模型,但在ARC Pr...