图像生成

谷歌发布最新「读屏」AI！PaLM 2-S自动生成数据，多项理解任务刷新SOTA

摘要：谷歌的最新研究成果ScreenAI是一个强大的视觉语言模型，它在理解和操作用户界面方面取得了显著进展。这个模型能够执行屏幕问答、内容摘要等多种任务，...

AIGC动态

11个月前

OpenAI 发布的新产品 Sora 引起了广泛关注，因为它可以根据文本描述生成具有多种风格、不同画幅、最长为 60s 的高清视频，且包含丰富的细节。这一事件再次证...

AIGC动态

11个月前

谷歌的新人工智能工具Gemini在图像生成功能上出现了严重的白人偏见问题，引发了公众争议。联合创始人布林承认了问题的存在，并表示公司在图像生成方面确实出...

AIGC动态

11个月前

在这篇文章中，介绍了Anthropic公司最新发布的Claude 3家族，包括小杯Haiku、中杯Sonnet和大杯Opus。这些模型在性能参数和响应时间上都有显著提升，Opus在多...

AIGC动态

11个月前

摘要：Anthropic发布了新一代AI大模型系列——Claude 3，包含Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus三个模型。Claude 3 Opus在多项基准测试中得分超...

AIGC动态

11个月前

Anthropic，被视为OpenAI最强的竞争对手，最近宣布推出了Claude 3系列模型，包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。这些模型不仅在性能上超越...

AIGC动态

11个月前

在当今世界，OpenAI和英伟达是两家备受瞩目的公司。OpenAI开发了三个颠覆性产品，其中包括ChatGPT，这是一款智能聊天机器人，能够根据用户提供的文字描述提供...

AIGC动态

11个月前

苹果公司最新研发的AI工具Keyframer，能够通过文本描述将静态图像转化为动画。这项技术利用了大型语言模型（LLM）的代码生成能力，允许用户通过自然语言提示...

AIGC动态

11个月前

模型信息【模型公司】月之暗面【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★ 文章摘要【关键词】机器之心、Sora、多模态、AnyGPT...

AIGC动态

11个月前

摘要：本文介绍了一种基于光栅化的单目动态场景建模pipeline，由浙江大学和字节跳动的研究团队提出。该方法通过结合变形场和3D高斯，实现了高质量的动态场景...

AIGC动态

11个月前