标签:大模型
如何把大模型压缩到1bit?论文作者这样说
这篇文章讨论了对大模型进行压缩的重要性,尤其是在部署代价高昂的情况下。模型量化是一种压缩方法,通过将大模型的参数转换为低位宽的表示来节省空间占用。...
国产大模型创业一哥:秀商业化,布局Sora,“全线对标OpenAI”
文章介绍了智谱AI在商业化领域的最新进展,包括融资、投资和商业化成果。智谱AI在过去一年中获得了超过25亿元的融资,同时积极投资于大模型公司。在商业化方...
媲美 GPT4,科大讯飞,再出王炸!
科大讯飞去年推出了星火大模型,受到用户好评,随后陆续推出多个版本,包括多模态、文生图、插件助手等新功能。今年初,他们发布了科大讯飞星火认知大模型V3....
AI味儿最浓的一届AWE,家电厂商都有哪些花活?
本文报道了2024年3月14日在上海新国际博览中心举办的AWE2024(中国家电及消费电子博览会)的情况。文章指出今年AWE的一个主要关键词是“AI家电”,多家家电企业...
突发!苹果、腾讯同日公布全新大模型研究论文,中美 AI 技术竞争加速|钛媒体AGI
苹果公司近日在人工智能领域迈出重要一步,公布了自家的多模态大模型MM1。这一模型拥有高达300亿的参数规模,在预训练指标中实现SOTA,并具备密集模型和混合...
加速分化:关于大模型走势的十个判断
中国基础大模型的数量会快速收敛,随着国外大模型能力的加速提升,国内资源不强的'套壳'大模型厂商将难以跟进,行业将呈现几家大厂和少数明星创业企业竞技的...
能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径
文章介绍了文本大模型技术的最新进展,其中提到了Claude 3在数学、编程、多语言理解、视觉等多个维度超越了GPT-4和Gemini 1.0 Ultra。为了分享大模型技术的最...
GPT-5临近上线,中美AI差距悬殊?这个国产方案「弯道超车」抢先狙击
GPT-5和GPT-4.5的传言满天飞,人们对OpenAI发布新模型充满期待。同时也有人质疑,国内外差距是否在拉大。但事实上,在大模型的行业应用落地方面,中国很可能...
智谱AI给中国大模型公司的商业化打了样
智谱AI,一家由清华大学知识工程实验室孵化的人工智能公司,已经在人工智能领域取得了显著的成果。在2023年,该公司累计获得超过25亿元的融资,成为国内估值...
透过科大讯飞的“AI+”行业实地战,看中国新质生产力变革的未来之路
人工智能+(AI+)在2024年两会中首次被写入政府工作报告,标志着国家将加强顶层设计,加速形成以AI为引擎的新质生产力。全国人大代表、科大讯飞的董事长刘庆...