“模型优化”的搜索结果

13.11 和 13.8 哪个大,不只是人类,为什么连大模型也翻车了?
在《歌手2024》第十期竞演排名公布后,社交媒体上的观众对数字大小的比较产生了疑问,而一些AI大模型在回答这类问题时也出现了错误。例...
直击算力焦虑,这家清华系 AI 创企搞了个千卡异构混训平台,算力利用率最高达 97.6%
GPT-4等大型模型在自然语言处理、机器翻译和文本生成等领域取得了显著成就,但随着模型参数的增加,计算和内存需求也随之增加,给算力和...
清华汪玉教授团队支招:如何把“大”模型部署到“小”设备上 | Q福利
2024年,AI驱动的应用产品如GPT-4o等因其广泛的应用前景而受到广泛关注,这促使大量资源被投入到AI的基础建设中,包括算法研究、数据清...
GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
字节跳动大模型团队开发的Depth Anything V2模型已入选苹果公司Core ML模型库,该模型是一种单目深度估计模型,包含不同大小的版本,适...
清华大学汪玉:大模型能效提升,有几条必经之路?
在AICon全球人工智能开发与应用大会上,清华大学电子工程系教授汪玉发表了题为《可持续的智能:大模型高能效系统前瞻》的演讲,深入探讨...
AI Agent的基础设施还不健全
生成式人工智能(AI)应用正经历着爆发式增长,广泛应用于多个领域,包括生产力提升、开发、云基础设施管理、媒体消费,以及医疗收入周...
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
在人工智能领域,大语言模型(LLM)的控制与指导是核心挑战之一。早期,人类反馈的强化学习方法(RLHF)被用来管理这些模型,取得了显著...
解码RAG:智谱 RAG 技术的探索与实践
智谱AI长期致力于大模型技术的研究,尤其在RAG(Retrieval-Augmented Generation)应用领域积累了丰富的经验。RAG技术通过Indexing(知...
苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo
苹果推出了深度集成于iOS 18、iPadOS 18和macOS Sequoia的全新个性化智能系统——Apple Intelligence。该系统包含两种基础模型:一款拥有...
Stable diffusion 3 正式开源
Stability AI近日宣布开源其文生图片模型——Stable Diffusion 3 Medium(简称SD3-M)。该模型拥有20亿参数,在保证高推理效率的同时,对...
1 2 3 4 5