标签:模型优化
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快
谷歌近期在人工智能领域取得了显著进展,特别是在开发高效且安全的AI模型方面。该公司开源了Gemma 2模型系列,包括9B和27B版本,并在对话任务中展现出超越规...
13.11 和 13.8 哪个大,不只是人类,为什么连大模型也翻车了?
在《歌手2024》第十期竞演排名公布后,社交媒体上的观众对数字大小的比较产生了疑问,而一些AI大模型在回答这类问题时也出现了错误。例如,当被问及'9.11和9....
直击算力焦虑,这家清华系 AI 创企搞了个千卡异构混训平台,算力利用率最高达 97.6%
GPT-4等大型模型在自然语言处理、机器翻译和文本生成等领域取得了显著成就,但随着模型参数的增加,计算和内存需求也随之增加,给算力和内存带来了巨大挑战。...
清华汪玉教授团队支招:如何把“大”模型部署到“小”设备上 | Q福利
2024年,AI驱动的应用产品如GPT-4o等因其广泛的应用前景而受到广泛关注,这促使大量资源被投入到AI的基础建设中,包括算法研究、数据清洗和算力提升。这些应...
GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了
字节跳动大模型团队开发的Depth Anything V2模型已入选苹果公司Core ML模型库,该模型是一种单目深度估计模型,包含不同大小的版本,适用于多种领域。Depth A...
AI Agent的基础设施还不健全
生成式人工智能(AI)应用正经历着爆发式增长,广泛应用于多个领域,包括生产力提升、开发、云基础设施管理、媒体消费,以及医疗收入周期管理等。这一增长得...
解码RAG:智谱 RAG 技术的探索与实践
智谱AI长期致力于大模型技术的研究,尤其在RAG(Retrieval-Augmented Generation)应用领域积累了丰富的经验。RAG技术通过Indexing(知识存储)、Retrieval(...
Stable diffusion 3 正式开源
Stability AI近日宣布开源其文生图片模型——Stable Diffusion 3 Medium(简称SD3-M)。该模型拥有20亿参数,在保证高推理效率的同时,对硬件需求较低,适合在P...
超越DPO,创新大模型优化算法SimPO
在人工智能领域,大模型如ChatGPT的优化至关重要特别是在根据人类反馈调整性能和减少非法内容输出方面。传统的直接偏好优化(DPO)方法依赖于参考模型,存在...
Meta等最新研究:多token预测,提升大模型推理效率
在自然语言处理领域,大语言模型如GPT-4、Gemini系列和Llama-3等,通常采用下一个token预测的损失函数进行预训练。然而,这种预训练方法需要大量数据且可能降...