标签:机器之心
清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!
摘要总结:清华大学和哈尔滨工业大学的研究团队在模型量化领域取得了重要进展,他们提出了一种名为「OneBit」的方法,成功将大型语言模型(LLM)压缩至1bit,...
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
摘要:谷歌 DeepMind 最近推出了两种新的 AI 模型,Hawk 和 Griffin,它们在基础模型方面为 AI 领域提供了新的选择。这些模型是基于循环神经网络(RNN)的,...
因为AI,构建「腹部地图」这个医学工作加速了数百倍
人体器官分割技术在医学图像分析中扮演着至关重要的角色,尤其是在自动化疾病诊断和手术治疗方面。传统上,这一过程依赖于放射科医生手动完成,不仅耗时而且...
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分
上海交通大学生成式人工智能实验室(GAIR)发布了一项新研究成果,深入分析了人类用户与32种流行大语言模型的偏好。研究通过真实用户-模型对话数据,分场景建...
ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计
斯坦福大学的研究者提出了一种名为“潜在透明度”的方法,使得大规模预训练的潜在扩散模型能够生成透明图像以及多个透明图层。这一进展与市场对分层内容生成的...
2万多亿美元,英伟达市值创新高,华尔街排第三
英伟达的市值在周五首次超过2万亿美元,成为华尔街第三大价值公司,仅次于微软和苹果。这一增长得益于戴尔发布的乐观报告,指出英伟达针对人工智能优化的服务...
马斯克起诉OpenAI:他们做出了AGI还授权给微软,这是对创始协议赤裸裸的背叛
马斯克最近对自己参与创立的公司OpenAI提起了诉讼,这一事件引起了广泛关注。在诉讼文件中,马斯克指控OpenAI不计后果地开发人类级别的人工智能(AGI),并将...
能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了
摘要:2023年,多模态大语言模型(MLLM)在文本、代码、图像、视频等领域取得了显著进展。上海人工智能实验室联合多所大学发布了一份详尽的评测报告,对GPT-4...
首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2
SnapChat背后的公司Snap联合特伦托大学等机构发布了一款名为Snap Video的文本生成视频模型。该模型采用了可扩展的时空Transformer架构,旨在提高视频生成的质...
微软37页论文逆向工程Sora,得到了哪些结论?
摘要:本文回顾了Sora视频技术的发展背景、技术细节、应用前景以及局限性。Sora是OpenAI开发的一种能够根据文本指令生成长达一分钟视频的模型,它在视觉质量...