大模型

Hugging Face发布AI代码生成工具StarCoder 2，支持600多种编程语言

摘要：开发者们正迅速采用AI驱动的代码生成器，如GitHub Copilot和Amazon CodeWhisperer，以及Meta的Code Llama。然而，这些工具存在局限性，如成本和许可证...

AIGC动态

9个月前

摘要：谷歌的Gemini Pro 1.5发布后，因无法生成“白人形象”而引发争议，被指责存在价值观上的歧视。谷歌CEO Sundar Pichai 发表声明，承诺进行结构性改变。此...

AIGC动态

9个月前

摘要：图像匹配是计算机视觉中的关键任务，对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限，而基于深度学习的模型受限于特定场...

AIGC动态

9个月前

摘要总结：Sora的创新：2024年，Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式，结合Transformer和扩散模型，展现...

AIGC动态

9个月前

Meta的LLaMa 3模型正在开发中，旨在解决LLaMa 2在回答有争议问题时的保守性问题。LLaMa 2在处理极端情况时的保守性是必要的，如暴力或非法活动相关查询，但这...

AIGC动态

9个月前

摘要：近期，微软研究院、国科大等机构的研究者提出了一种革命性的1-bit大模型，这一技术在AI领域引起了广泛关注。该研究通过将大模型的权重改为三元表示，实...

AIGC动态

9个月前

摘要：机器之心报道了阿里巴巴智能计算研究院的EMO（Emote Portrait Alive）框架，这是一个音频-视频合成方法，用于生成表现力强、真实度高的说话人头部视频...

AIGC动态

9个月前

陈丹琦团队发布了一种名为CEPE（并行编码上下文扩展）的新方法，该方法通过添加小型编码器和交叉注意力模块，扩展了预训练和指令微调模型的上下文窗口。这种...

AIGC动态

9个月前

在最新的研究中，微软和中国中科院大学提出了一种名为BitNet b1.58的方法，标志着大语言模型（LLM）进入了“1-bit时代”。这种方法通过将传统16位浮点数存储转...

AIGC动态

9个月前

摘要总结：阿里推出了一款名为EMO的基于音频驱动的肖像视频生成框架，引起了广泛关注。用户只需提供一张参考图像和一段音频，即可生成表情生动的AI视频。这项...

AIGC动态

9个月前