图像生成
图像,绘画
刚拿下NeurIPS最佳论文,字节就开源VAR文生图版本,拿下SOTA击败扩散模型
字节跳动商业化技术团队开发了一款名为Infinity的自回归文生图新模型,该模型在图像生成质量上超越了扩散模型,并在推理速度上继承了VAR的速度优势。Infinity...
OpenAI再招华人研究员!高中入围美国“少年诺贝尔奖”,还在哈佛教书
哈佛华人研究员Jeffrey Wang宣布加入OpenAI,担任基础团队研究员,负责模型预训练和推理。此前,Wang在哈佛一边教课一边研究机器学习。他于2021年本科入学哈...
创新突破!字节跳动首创无需数据,1.58位超低量化自监督生成
字节跳动研究人员针对大型语言模型(LLM)在推理和生成过程中占用大量内存的问题,提出了一种创新的量化方法。该方法不依赖实际图像数据,仅利用模型自身的自...
联手OpenAI,吴恩达推出一门o1推理新课程,还免费
2024年,OpenAI推出了o系列模型,这些模型通过更多的计算进行深入“思考”,能够回答更复杂、更细致的问题。o系列模型在多步骤规划、图像推理和长期编码等新兴...
AI Agent 创新突破!从「耍嘴皮」到「看得见」,还能「动手干」
在AI技术飞速发展的背景下,无界方舟团队在极客公园IF2025创新大会上提出了“个人基础智能体”(Personal Foundation agent)的概念,为AI Agent的发展提供了新...
AI视频突飞猛进这一年,国产之光可灵AI笑到最后
2024年,AI视频生成领域迎来了重大突破,其中可灵AI以其卓越的技术和产品体验成为全球领先者。可灵AI在半年内经历了10余次迭代,平均每月至少更新两次,迅速...
JHU 陈杰能:世界模型+心智模型,让具身智能体拥有「想象力」
近日,马尔奖得主、约翰霍普金斯大学教授Alan Yuille的团队发布了一项名为GenEx的具身智能领域重要成果,该成果通过模拟人类大脑的认知方式和理解机制,推动...
大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?
近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...
在无人注意的蓝海里,PixVerse正踏上登神长阶。
PixVerse v3.5版本在周末悄然上线,带来了显著的更新,特别是在语义理解和运动质量方面,达到了T1梯队的水平。新版本在图像生成速度上表现出色,720p的图像大...
你还说这是AI?我们体验了一波生成亚洲人最好看的文生图大模型
近期,社交媒体上热议的“ AI 模特”功能引起了广泛关注。这一功能由可灵 AI 提供,它能够一站式生成模特主体、换装、展示视频,其最新版本“可图 1.5”和“可灵 1...