标签:合成数据

比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座

科技媒体The Verge报道称,OpenAI计划在12月推出名为Orion的大模型,该模型将使用合成数据预训练,并混合其他模型以实现比GPT-4强100倍的性能,接近人工通用...

大模型「强崩溃」!Meta新作:合成数据有「剧毒」,1%即成LLM杀手

近期,来自Meta、纽约大学和加州大学洛杉矶分校(UCLA)的研究团队在一篇论文中探讨了合成数据对大型语言模型(LLM)的影响。研究发现,即使合成数据在总数据...

对话复旦大学教授肖仰华:千亿大模型可能有极大“水分”下,如何用更优质的数据发展中国AI技术?|钛媒体AGI

在AI大模型技术的发展中,数据的质量和数量成为了关键因素。随着模型规模的不断扩大,对数据的需求也在不断增长。然而,据Epoch AI的数据显示,预计到2028年...

消息称OpenAI今年秋天发布“草莓”模型技术,ChatGPT月收入已达2.83 亿美元,公司估值超6100亿|钛媒体AGI

OpenAI计划在今年秋季推出一款名为Strawberry的新AI模型技术,该技术可能作为聊天机器人ChatGPT的一部分功能。Strawberry模型能够解决以前从未见过的数学问题...

牛津剑桥「投毒」AI失败9次登Nature封面,引爆学术圈激辩!AI训AI能否打破崩溃魔咒?

牛津、剑桥、帝国理工和多伦多大学等机构的研究人员在Nature杂志上发表了一篇关于人工智能(AI)模型崩溃的论文,引发了学术界和AI社区的广泛关注和讨论。论...

深度|大模型真的在吞噬人类的一切数据吗?

弗兰克·赫伯特的科幻巨著《沙丘》中,沙漠星球厄拉科斯下的香料是宇宙中最宝贵的资源,它不仅驱动了太空旅行,还具有延长寿命和扩展意识的能力。在现实世界中...

清华SuperBench全球测评出炉,Claude 3拿下多个冠军!合成数据才是人类未来?

清华大学SuperBench团队最近发布了新一轮的全球大模型评测结果。在语义理解、智能体能力和代码能力三个测评中,Claude 3模型表现出色,拿下两个第一名,并在...

Llama架构比不上GPT2?神奇token提升10倍记忆?

这篇文章主要介绍了朱泽园和李远志最新研究的内容,标题为《语言模型物理学 Part 3.3:知识的 Scaling Laws》。他们通过海量实验总结了12条定律,为语言模型...

没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路

2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转录YouTube视频中的音...

OpenAI曾转录100万小时视频数据,训练GPT-4

随着人工智能技术的飞速发展,大语言模型(LLM)已成为科技巨头们争夺的新战场。专注于AIGC领域的专业社区密切关注着微软 & OpenAI、百度文心一言、讯飞星火...
1 2