大模型
LLM,VLM,模型
孟瑜获杰出博士论文奖,中科大获最佳学生论文,KDD 2024全部奖项放出
第30届ACM SIGKDD国际数据挖掘与知识发现大会(KDD 2024)在西班牙巴塞罗那成功举行,多项大奖揭晓。华人研究者在此次大会上表现突出,孟瑜的《Efficient and...
GPT-5降临,代号猎户座?OpenAI疑用草莓训练,数学推理暴涨超越所有模型
OpenAI正在开发下一代旗舰大语言模型,代号为Orion(猎户座),预计其将超越当前的GPT-4模型。Orion的预训练数据由草莓模型生成,草莓模型具有强大的复杂推理...
不发 GPT-5、直接上 GPT-6?曝 OpenAI 新模型代号 Orion,目标“杀死”幻觉
OpenAI 正在开发一个名为“草莓”的项目,该项目旨在推出一款超越 GPT-4 的大语言模型,代号为 Orion。草莓项目最早可能在今年秋季发布,将作为 ChatGPT 的一部...
全球最大芯片,进军推理:1800 token/秒,全球最快
Cerebras Systems,一家以挑战英伟达在AI芯片市场地位为目标的公司,于今年年初推出了WSE-3 AI芯片,专为训练大型AI模型而设计。这款基于5nm工艺、拥有4万亿...
突发!OpenAI展示草莓,很快发布“GPT-5”猎户座!
OpenAI近期展示了其秘密项目“草莓”和“猎户座”,这两个项目均聚焦于大语言模型(LLM)的发展。草莓项目旨在解决复杂推理任务,特别是在数学和编程领域,同时增...
a16z投资,两个月400万用户,华人AI产品席卷Discord
Viggle AI,一家以视频生成服务而知名的初创公司,最近宣布完成了1900万美元的早期投资,其中Andreessen Horowitz为领投方。该公司由曾在Google、NVIDIA、Fac...
大发现!谷歌证明反学习,无法让大模型删除不良信息
本文探讨了大语言模型(LLM)在处理不良信息时所面临的挑战,特别是反学习(Unlearning)技术的应用及其局限性。研究发现,尽管反学习技术在理论上可以有效地...
中国AI芯片龙头燧原科技启动IPO上市辅导,腾讯持股超20%,公司估值超160亿元
上海燧原科技股份有限公司(燧原科技)已正式启动科创板IPO上市程序,有望成为继寒武纪之后,国内科创板上第二家AI算力设计公司。燧原科技成立于2018年3月,...
消息称OpenAI今年秋天发布“草莓”模型技术,ChatGPT月收入已达2.83 亿美元,公司估值超6100亿|钛媒体AGI
OpenAI计划在今年秋季推出一款名为Strawberry的新AI模型技术,该技术可能作为聊天机器人ChatGPT的一部分功能。Strawberry模型能够解决以前从未见过的数学问题...
大模型时代,绿色计算这条路该怎么走?
随着人工智能时代的到来,大模型的发展推动了智能算力需求的急剧增长。自2012年以来,人工智能模型训练所需的算力每3至4个月翻一番,年增长率达到10倍。这一...