图像生成
图像,绘画
AI短视频制作必备工具: 图像/视频生成,音乐和音效素材,口型匹配,TTS配音
这篇文章介绍了一些免费、简单好用的工具和素材,以帮助人们以最低的成本制作高质量的视频。首先介绍了图像和视频生成工具,包括Midjourney V6、RunwayML、Ge...
大语言模型 vs 大模型
本文主要介绍了大模型的概念、分类以及与大语言模型的关系。大模型是基于神经网络的一种模型,由多个神经元组成,通过权重连接形成层次结构。神经网络通过学...
32.1K Star开源AI开发神器,图片到代码这么丝滑,程序员瑟瑟发抖中
这篇文章介绍了一款名为Screenshot to Code的开源人工智能工具,可以根据截图自动生成实际可用的源代码网页。该工具利用GPT-4生成代码,并使用DALL-E3生成外...
Meta与OpenAI文生图工具评测-下
这篇文章主要是对两款文生图AI工具Imagine with Meta和DALL-E3生成的图片进行了详细的评测。评测过程中,使用了GPT4来完成评测,通过专业的软件评测师对绘图...
适配王炸功能,真·拟人讯飞星火大模型V3.5的360°实测
2024年被认为是国产大模型技术的全面爆发年,科大讯飞推出的讯飞星火认知大模型V3.5在多个领域实现了全面提升,并在语音大模型技术方面取得革命性进展。讯飞...
AI绘画中CLIP文本-图像预训练模型
感谢您提供的文章总结。下面是对文章中所有重要的词语或语句进行加粗处理:介绍OpenAI 在 2021 年提出了 CLIP(Contrastive Language–Image Pretraining)算...
港大与TikTok合作研发Depth Anything,从单张图像解锁深度信息,引领MDE新纪元
这篇文章主要介绍了单目深度估计(MDE)面临的挑战和机遇,以及香港大学和TikTok合作研发的Depth Anything模型的技术创新和应用前景。文章首先指出MDE面临数...
OpenAI 危险了?Gemini 和 GPT4 比较,谁强,只需两张图秒懂;Gemini 天生多模态,很可能是不一样的技术路线
Gemini 和 GPT-4 是两种人工智能模型,Gemini 天生多模态,而 GPT-4 是靠多功能的拼装。 Gemini 在多个测试中得分均高于 GPT-4,包括一般性测试、复杂任务集...
小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜
这篇文章介绍了一种名为InstantID的图像生成技术,它能够通过上传一张照片,即刻生成多种风格的AI写真。这项技术由小红书的95后团队InstantX开发,受到了广泛...
生成式人工智能AIGC的前世今生和未来
生成式人工智能的开发涉及数据收集、模型训练、评估、优化、部署、监控和维护等多个领域。随着技术的发展,一些新的挑战和问题也随之而来,如平衡生成结果的...