GPT-GPTs

GPT,GPTs,Prompt

模型评测不是用来刷榜的,智源要用“辩论赛”的方式找回评测该有的样子

在人工智能国际顶会NeurIPS 2024上,大模型评测成为焦点,7000余篇投稿与之相关。去年,评测榜单因刷榜行为受争议,如C-Eval和SuperCLUE。评测大模型比构建更...

o3曝智商高达157,比肩爱因斯坦碾压99%人类!陶哲轩水平AI或出现

OpenAI的o3模型因其高达157的智商而受到广泛关注,这一智商水平超过了99%的人类,引发了关于人工智能发展速度和潜力的讨论。o3模型的智商是基于Codeforces编...

ChatGPT搜索带火Perplexity,获5亿美元、估值90亿美元

生成式AI搜索平台Perplexity近期完成了5亿美元的融资,估值飙升至90亿美元,由Institutional Venture领投。年初时,Perplexity的估值仅为10亿美元,6月份增至...

从 OpenAI 12 天发布会里,我们看到了行业的四个关键问题

OpenAI的12天连续发布会虽然在科技界引起了广泛关注,但最终被认为亮点不足,未达预期。尽管如此,最后一天发布的o3推理模型在数学、代码、物理等多项测试中...

o3模型智商157,比肩爱因斯坦!AI只用7个月,超过人类100年

OpenAI的新模型o3在Codeforces上的评级为2727,超越了全球99.8%的程序员。若将此评级转化为智商,o3的智商约为157,接近历史上爱因斯坦的智商160以上。尽管AI...

如何理解 OpenAI o3 ?以及对其的技术分析

O3作为OpenAI的新一代模型,继承自O1,其命名跳过O2是为避免与同名公司混淆。尽管O3并非AGI,但其能力在某些方面已超越人类,这一点从ChatGPT 3.5延续至今,...

GPT-5 研发一年半进度堪忧!每轮 5 亿美金训练成本打水漂,还得雇人从头“造数据”

GPT-5(代号Orion)项目自研发以来已超过18个月,但仍未有成品出现。《华尔街日报》报道指出,尽管Orion的性能优于OpenAI当前的模型,但其进步不足以证明继续...

豆包说要「普惠」,于是大模型处理图片按「厘」计价了

近期,字节跳动在2024冬季火山引擎FORCE原动力大会上推出了豆包大模型家族的新成员——豆包・视觉理解模型,该模型具备强大的视觉理解能力,能够处理复杂视觉问...

百川智能发布金融大模型 Baichuan4-Finance,整体准确率领先GPT-4o近20%

百川智能于12月23日发布了全链路领域增强大模型Baichuan4-Finance,该模型在高质量金融数据的基础上,通过领域自约束训练方案,实现了金融能力和通用能力同步...

百川新模型超GPT-4o近20%,首创自约束训练方案突破瓶颈,主打「领域增强」

全链路金融领域增强大模型Baichuan4-Finance在金融领域的表现超越了GPT-4o,成为新的金融领域大模型领导者。这一成就归功于百川智能的全链条领域增强方案,该...
1 2 3 4 5 186