“模型架构”的搜索结果

在自然语言处理领域，大语言模型如GPT-4、Gemini系列和Llama-3等，通常采用下一个token预测的损失函数进行预训练。然而，这种预训练方法...

AIGC动态

4个月前

最近中国大模型领域掀起了一场价格战，由量化对冲基金幻方旗下的AI团队深度求索引发。深度求索发布了新的模型DeepSeek-V2，并将API价格...

AIGC动态

4个月前

Pitchbook发布的2024年Q1全球人工智能与机器学习领域的投融资数据显示，该季度共完成1779笔融资交易，筹集风险投资总额216亿美元。其中...

AIGC动态

4个月前

Chameleon模型挑战了OpenAI的GPT-4o，成为首个敢于与之一较高下的新模型。Chameleon采用统一的Transformer架构，能够在单一神经网络中无...

AIGC动态

4个月前

文章讨论了AI绘图领域的发展，特别是在开源AI绘图大模型方面的进展。作者表达了对拥有一个国内自主开发、中文驱动的开源AI绘图大模型的...

AIGC动态

4个月前

智谱AI在ICLR 2024大会上公布了面向AGI通用人工智能前景的三大技术趋势，并预告了GLM的后续升级版本。同时，智谱大模型开放平台上线了新...

AIGC动态

4个月前

2023年以来，多模态视频生成技术取得了显著的进展，其中OpenAI旗下视频生成模型Sora在2024年2月发布后迅速成为全球焦点。Sora在视频生成...

AIGC动态

5个月前

摘要近期，Meta AI主管Yann LeCun在一次访谈中透露，Meta为购买英伟达GPU已经花费了300亿美元，这一投资额超过了历史上著名的阿波罗登月...

AIGC动态

5个月前

背景介绍：Meta公司在2023年2月组建了一个跨领域的团队，致力于开发Llama系列模型。Llama 2模型于2023年7月发布，参数范围从7B到70B，代...

AIGC动态

5个月前

本文介绍了由智子引擎团队研发的多模态大模型Awaker 1.0，该模型在多模态任务中表现出色，特别是在数据生成和模型自主更新方面具有创新...

AIGC动态

5个月前