“模型架构”的搜索结果

Meta等最新研究:多token预测,提升大模型推理效率
在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法...
量化起家,万卡在手,降价狂魔,DeepSeek可能就是中国大模型混战的终结者
最近中国大模型领域掀起了一场价格战,由量化对冲基金幻方旗下的AI团队深度求索引发。深度求索发布了新的模型DeepSeek-V2,并将API价格...
最新!今年一季度,全球AI领域融资总额达1564亿,同比下降31.2%|钛媒体AGI
Pitchbook发布的2024年Q1全球人工智能与机器学习领域的投融资数据显示,该季度共完成1779笔融资交易,筹集风险投资总额216亿美元。其中...
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
Chameleon模型挑战了OpenAI的GPT-4o,成为首个敢于与之一较高下的新模型。Chameleon采用统一的Transformer架构,能够在单一神经网络中无...
我们也终于有了自己的开源AI绘图大模型,它叫,腾讯混元。
文章讨论了AI绘图领域的发展,特别是在开源AI绘图大模型方面的进展。作者表达了对拥有一个国内自主开发、中文驱动的开源AI绘图大模型的...
百万tokens低至1元!大模型越来越卷了
智谱AI在ICLR 2024大会上公布了面向AGI通用人工智能前景的三大技术趋势,并预告了GLM的后续升级版本。同时,智谱大模型开放平台上线了新...
GPT-3水平的Sora 就强大到不敢给普通人用?可我也不知道把它用在哪儿
2023年以来,多模态视频生成技术取得了显著的进展,其中OpenAI旗下视频生成模型Sora在2024年2月发布后迅速成为全球焦点。Sora在视频生成...
Meta训AI,成本已超阿波罗登月!谷歌豪言投资超千亿美元,赛过OpenAI星际之门
摘要近期,Meta AI主管Yann LeCun在一次访谈中透露,Meta为购买英伟达GPU已经花费了300亿美元,这一投资额超过了历史上著名的阿波罗登月...
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
背景介绍:Meta公司在2023年2月组建了一个跨领域的团队,致力于开发Llama系列模型。Llama 2模型于2023年7月发布,参数范围从7B到70B,代...
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0,该模型在多模态任务中表现出色,特别是在数据生成和模型自主更新方面具有创新...
1 3 4 5 6 7 11