标签:大模型
前谷歌科学家离职创业1年,自述训练LLM卡在算力上!买卡就像中彩票,Karpathy转赞
Yi Tay,前谷歌大脑科学家,分享了他在离职后创办初创公司并训练大模型的经历。他强调了算力稀缺和算力提供商之间的巨大差异是训练大模型的主要难题。
朱啸虎说:中国大部分AI大模型公司都会倒闭关门
文章总结如下:1. ChatGPT3.5推出后,国内许多公司开始涌入AI大模型领域,导致百模大战和乱象丛生,但大部分国内大模型与国外GPT4相比存在差距。2. 投资人朱...
阿里包揽中国估值最高的5家大模型独角兽
这篇文章介绍了阿里巴巴在对AI大模型初创企业的投资竞赛中的表现,成为中国互联网巨头中最大的投资者。阿里已经投资了5家估值超过10亿美元的AI大模型初创公司...
阿里地毯式“买断”大模型赛道
这篇文章讨论了中国大型科技公司对大模型创业公司的投资和布局。最近,阿里领投了大模型初创公司MiniMax的新一轮融资,而另一家大模型创业企业月之暗面也传出...
让大模型“瘦身”90%!清华&哈工大提出极限压缩方案:1bit量化,能力同时保留83%
### 摘要总结清华大学和哈尔滨工业大学的研究团队提出了一种名为OneBit的大模型1bit极限压缩框架,实现了大模型权重压缩超过90%的同时保留83%的能力。这一突...
(待会删)全网独一份AI大模型资源,请低调使用!
这篇文章讨论了当前国内巨头公司如华为、百度和阿里在人工智能大模型领域的竞争激烈情况,以及这种狂热对于AI人才市场的影响。文章指出,大模型技术已经渗透...
周鸿祎:不拥抱AI的公司,员工会被淘汰
2024年2月中旬,Open AI发布了首个文生视频模型Sora,引发了AI界的热议。16个月前ChatGPT的诞生已经显示出人工智能领域的快速发展。在去年全国两会上,周鸿祎...
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4
摘要:本文报道了美国 AI 创业公司 Inflection AI 发布的新一代大语言模型 Inflection-2.5,该模型结合了强大的LLM能力和Inflection标志性的「同理心微调」,...
40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果
摘要:克雷西报道了由DeepMind联合创始人Mustafa Suleyman领导的大模型初创公司Inflection-2.5推出的新产品Pi,以及该公司背后的故事。Inflection-2.5是一款...
大模型的能力被夸大了
大模型技术,尤其是语言模型(LLM),被广泛认为是提升工作效率的关键技术。麦肯锡的预测显示,LLM和其他生成式AI技术每年能为全球企业带来高达4.4万亿美元的...