标签:月之暗面
Gemini翻车,谷歌决策十字路口:该解雇CEO还是该进行“结构化变革”?
摘要:谷歌的Gemini Pro 1.5发布后,因无法生成“白人形象”而引发争议,被指责存在价值观上的歧视。谷歌CEO Sundar Pichai 发表声明,承诺进行结构性改变。此...
ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型
摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...
LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训
Meta的LLaMa 3模型正在开发中,旨在解决LLaMa 2在回答有争议问题时的保守性问题。LLaMa 2在处理极端情况时的保守性是必要的,如暴力或非法活动相关查询,但这...
微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41
摘要:近期,微软研究院、国科大等机构的研究者提出了一种革命性的1-bit大模型,这一技术在AI领域引起了广泛关注。该研究通过将大模型的权重改为三元表示,实...
让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了
摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...
基于神经网络的偏微分方程求解器新突破:北大&字节研究成果入选Nature子刊
摘要:北京大学与字节跳动研究部门 ByteDance Research 联合开发的计算框架 Forward Laplacian 在量子化学领域取得了显著进展。该框架通过利用 Laplace 算子...
阿里云疯狂星期四!史上最大力度降价来了:100+云产品官网直降20%
在28年一遇的2月29日,阿里云宣布了一项重大的降价活动,这是其历史上降价幅度最大的一次。平均降价幅度超过20%,部分产品最高降幅达到了55%。此次降价涉及10...
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
陈丹琦团队发布了一种名为CEPE(并行编码上下文扩展)的新方法,该方法通过添加小型编码器和交叉注意力模块,扩展了预训练和指令微调模型的上下文窗口。这种...
发现免费Sora学习资料,原来都藏在飞书
在AI革命的浪潮下,普通人如何适应成为了热门话题。许多“专家”和“老师”通过社交媒体平台提供课程和训练营。与此同时,飞书文档《通往AGI之路》因其丰富的内容...