GPT-GPTs
GPT,GPTs,Prompt
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
Llama 3.1,一个多语言大型语言模型(LLM)集合,最近在Reddit上泄露,引起了广泛关注。这个集合包含8B、70B和405B三种不同参数规模的模型,且在多项基准测试...
苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果
苹果公司近日在开源大模型领域取得了重大进展,推出了一款7B参数的模型,其性能与Llama 3 8B相当,且一次性开源了全部训练过程和资源。这一举措受到了业界的...
中国五连冠终结,美国重登IMO宝座!AI智商被第一题打回原形
第65届国际数学奥林匹克竞赛(IMO 2024)的最终结果已经揭晓,美国队以192分的成绩荣获第一名,领先中国队2分,打破了中国连续五年的冠军纪录。此次竞赛吸引...
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变
在大型语言模型(LLM)的发展历程中,我们见证了从编码器-解码器模型到仅解码器模型的转变。AI 创业公司 Reka 的首席科学家 Yi Tay 在其博客文章中深入探讨了...
Claude Sonnet 3.5 口碑爆棚!10 倍速开发,“2 个月内用 Rust 从零构建完一款产品”
技术创始人lapurita分享了使用Claude Sonnet 3.5实现10倍开发速度的经验,引起了开发者的共鸣。lapurita介绍了他的工作流程,包括与Claude讨论功能、编写基本...
给iPhone背面贴个AI录音机,生意老好了
Plaud Note是一款由深圳机智连接科技有限公司开发的AI卡片录音机,专为iPhone设计,能够贴在手机背面。这款产品在Indiegogo众筹平台上取得了巨大成功,销售额...
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
近期,人工智能领域出现了小模型的热潮。OpenAI推出了GPT-4o mini,Mistral AI与英伟达合作发布了Mistral NeMo,而苹果公司也加入了这一竞争,发布了包含70亿...
仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式
随着大模型应用的扩展,基础模型的参数数量不断增加,给训练带来了巨大负担。为了解决这一问题,研究者们开始关注高效微调(Parameter Efficient Fine-Tuning...
独家对话上海交大重庆AI研究院齐鹏团队:目前大模型水平只相当于一个仅懂文科的五岁孩童|钛媒体AGI
在一项测试中,12款国内外AI大模型被问及“9.11和9.9哪个更大”的简单数学问题,结果显示仅有4款模型回答正确,包括阿里通义千问、百度文心一言、Minimax和腾讯...
GPT-4o mini,你好!GPT-3.5 彻底再见!|AI 鲜测
OpenAI 最新推出的 GPT-4o mini 模型以其卓越的性价比和强大的多模态能力,重新定义了 AI 成本效益的标准。在 MMLU 中以 82% 的得分领先市场,成本仅为每百万...