标签:moonshot-v1-32k

“通信+AI”又有新成果,芯片巨头发布重磅芯片!

2023年,ChatGPT等AIGC技术引发了全球AI热潮。2024年,这股热潮通过Sora等新热点进一步升温,标志着AI黄金时代的到来。通信行业积极拥抱AI,将其与产业结合。...

Fine-tuning在垂直领域的最佳实践指南

摘要总结:本文介绍了深度学习和机器学习中的一个重要概念——Fine-tuning(模型微调)。Fine-tuning通常在预训练模型的基础上进行,通过在特定任务的数据集上...

Hugging Face发布AI代码生成工具StarCoder 2,支持600多种编程语言

摘要:开发者们正迅速采用AI驱动的代码生成器,如GitHub Copilot和Amazon CodeWhisperer,以及Meta的Code Llama。然而,这些工具存在局限性,如成本和许可证...

揭秘顺丰智慧物流背后的数据管理逻辑

顺丰科技在2023年发布了物流领域首个大规模应用的数字孪生实践,显著提升了中转场的产能。顺丰科技大数据总监林国强在InfoQ直播中介绍了顺丰的“1+1+n+x”框架...

Gemini翻车,谷歌决策十字路口:该解雇CEO还是该进行“结构化变革”?

摘要:谷歌的Gemini Pro 1.5发布后,因无法生成“白人形象”而引发争议,被指责存在价值观上的歧视。谷歌CEO Sundar Pichai 发表声明,承诺进行结构性改变。此...

ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型

摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...

LLaMa 3或将推迟到7月发布,剑指GPT-4,从Gemini吸取教训

Meta的LLaMa 3模型正在开发中,旨在解决LLaMa 2在回答有争议问题时的保守性问题。LLaMa 2在处理极端情况时的保守性是必要的,如暴力或非法活动相关查询,但这...

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

摘要:近期,微软研究院、国科大等机构的研究者提出了一种革命性的1-bit大模型,这一技术在AI领域引起了广泛关注。该研究通过将大模型的权重改为三元表示,实...

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...
1 33 34 35 36 37