“讯飞星火”的搜索结果

极大降低大模型训练内存需求,Meta等推出高效方法
该文章介绍了一个名为GaLore的高效训练方法,旨在解决大型语言模型在预训练过程中对内存需求过高的问题。研究人员发现,在训练过程中,...
Sora并非完美,致命缺点也很多
这篇文章主要介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况...
媲美 GPT4,科大讯飞,再出王炸!
科大讯飞去年推出了星火大模型,受到用户好评,随后陆续推出多个版本,包括多模态、文生图、插件助手等新功能。今年初,他们发布了科大...
文本生成4K超高清图像,华为等推出创新模型PixArt-Σ
是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一款文本生成4K超高清图像的模型。与上一代PixArt-α相比,在图像质量...
独家支持MoE大模型一键训练,达观大模型管理平台两大全新功能发布
达观大模型管理平台推出曹植MoE模型达观大模型管理平台(DATAGRAND)推出了支持中文的曹植MoE模型,以满足用户多样化的模型管理需求。曹...
首个AI程序员:能接单干私活,自动微调大模型!
文章介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的主题。其中,A...
惊喜加码!微软 AI 奥德赛助力 AI 工程师全面加速!
微软亚洲 AI 奥德赛(AI Odyssey)是为了帮助开发者更快地掌握人工智能知识和应用技能而推出的挑战之旅。参与者可以通过线上学习和交互...
AGI万字长文(上) | 2023回顾与反思
2023年是大模型澎湃发展的一年。虽然人们对于AI的短期能力有所高估,但长期来看,技术的稳定和加速度的迭代是不可避免的。大模型的涌现...
Llama-3公布基础训练设施,使用49,000个H100
这篇文章介绍了Meta在AI领域的最新动态。Meta宣布推出两个全新的24K H100 GPU集群,用于训练大型模型Llama-3,预计将于4月末或5月中旬上...
马斯克将在本周,开源类ChatGPT产品Grok
本文介绍了一个专注于AIGC领域的专业社区,关注微软 &OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章...
1 3 4 5 6 7 10