标签:大模型

仅用 8 张显卡和一万块钱,清华团队用7B模型打败GPT-4o数学推理

清华大学NLP实验室联合上海AI Lab、清华大学电子系及OpenBMB社区提出了一种新的结合过程奖励的强化学习方法PRIME(Process Reinforcement through IMplicit R...

造车的理想要「All in AI」,这事靠谱吗?

理想汽车近期通过「2024 理想 AI Talk」系列活动,展示了其在人工智能领域的最新进展和未来规划。公司董事长兼CEO李想宣布,基于自研基座大模型Mind GPT的理...

大厂加码AI,阿里云与“大模型六虎”零一万物成立产业大模型联合实验室|钛媒体AGI

阿里云与零一万物达成战略合作,共同成立“产业大模型联合实验室”,旨在加速大模型技术从研发到产业应用的转化,并扩大产业大模型的生态整合。此次合作将结合...

资源有限,如何构建高效能的 AI Agent

在AICon全球人工智能开发与应用大会2024北京站的专题圆桌交流中,业界专家探讨了AI Agent领域的最新进展和发展方向。专家们普遍认为,大模型技术将带来性能的...

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

微软在一篇关于医学相关benchmark——MEDEC的论文中意外泄露了OpenAI多个模型的参数规模。论文中提到了o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B等...

商汤贾安亚:大模型未来趋势是让大家变成更会用 AI 的人

商汤科技Copilot产品负责人贾安亚在接受InfoQ采访时,分享了对大模型生产力工具市场发展、价值应用与未来趋势的见解。她指出,大模型技术难点包括数据的数量...

超270个大模型下,如何解决“国外一开源,国内就创新”的AI安全治理挑战?|钛媒体AGI

阿里巴巴集团联合发布的《大模型技术发展及治理实践报告》揭示了AI技术治理与安全问题的重要性。全球AI企业数量已达3.6万家,其中美国占33.6%,中国占16%。中...

独享MRDIMM有多强?至强6性能核处理器的内存二三事

英特尔至强6性能核处理器的核心规模和内存控制器布局引发了业界的关注和讨论。原先预测的43内核加上两组双通道内存控制器的45网格布局被新的晶圆照片所推翻,...

AICon 北京站 2024 优秀出品人与明星讲师名单揭晓,AI + Data 、Agent、多模态专场最受欢迎

AICon全球人工智能开发与应用大会2024(北京站)于12月13日至14日成功举行,聚焦了RAG、AI Agent技术、大模型成本优化、具身智能应用、多模态大语言模型等前...

模型评测不是用来刷榜的,智源要用“辩论赛”的方式找回评测该有的样子

在人工智能国际顶会NeurIPS 2024上,大模型评测成为焦点,7000余篇投稿与之相关。去年,评测榜单因刷榜行为受争议,如C-Eval和SuperCLUE。评测大模型比构建更...
1 2 3 4 37