图像生成

图像,绘画

详解Latte:去年底上线的全球首个开源文生视频DiT

上海人工智能实验室的研究团队在视频生成领域取得了重要突破,他们成功开发了名为Latte的视频DiT模型。这是全球首个开源的文生视频DiT,受到了广泛的关注和使...

今年,中国AI大模型产业发展看这些

人工智能技术的发展正在给我们创造更大的震撼。生成式AI技术从引领技术爆发的GPT-4开始,已经席卷了各个领域。在可见的未来,向我们招手的还有具身智能,机器...

面对 AI,全球手机大厂们会怎样解题?

文章主要讨论了AI技术与手机行业的结合,以及这种结合对手机厂商的影响和挑战。首先,文章提到了一加发布的新款性价比旗舰一加ACE 3V,这款手机是第一批拥抱A...

阶跃星辰:大模型「new game」里的新玩家

在2024年3月23日的全球开发者先锋大会上,初创公司阶跃星辰发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型和Step-2...

深度对话阶跃星辰创始人姜大昕:“百模大战”下,大模型如何产生更大价值?|钛媒体AGI

姜大昕博士,前微软全球副总裁,现任阶跃星辰创始人及CEO,在2024年3月的全球开发者先锋大会上宣布了该公司在大型AI模型领域的重大进展。阶跃星辰在过去一年...

人人都能当周杰伦!Suno作曲,ChatGPT写词,网友用Transformer造出神曲!

近日,人工智能初创企业Suno发布了其音乐生成器Suno模型V3版本,并在官网提供免费试用。Suno模型能够根据用户输入的文本描述,生成包括歌词、人声和配器在内...

南洋理工发布多模态智能体 FinAgent,开启高效金融交易的创新之旅

金融市场的稳定和繁荣对经济发展至关重要,然而,随着金融市场的日益复杂化和全球化,传统的基于规则的量化交易系统因其缺乏对市场动态的适应性而日益显得力...

通用文档理解新SOTA,多模态大模型TextMonkey来了

华中科技大学和金山的研究人员在多模态大模型Monkey的基础上提出了TextMonkey,这是一个专注于文本相关任务的多模态大模型。TextMonkey在多个场景文本和文档...

离职谷歌的Transformer作者创业,连发3个模型(附技术报告)

去年8月,前谷歌研究人员David Ha和Llion Jones创立了位于日本东京的人工智能公司Sakana AI,其中Llion Jones是谷歌2017年经典研究论文《Attention is all yo...

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥大学信息工程系人工智能实验室最近开源了首个预训练、通用多模态后期交互知识检索器PreFLMR。该模型基于Fine-grained Late-interaction Multi-modal Retr...
1 70 71 72 73 74 99