图像生成
图像,绘画
o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor
GitHub Copilot 近期引入了多个新的AI模型,以增强其代码生成和辅助功能。这些新模型包括Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5 Pro以及OpenAI的...
古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了
xAI公司开发的Grok大模型在最新更新后获得了图像理解能力,这标志着科学文献数字化和标准化工作的重大进展。Grok能够将手写公式转换成LaTeX格式,准确率极高...
一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代
智源最近推出了一款名为OmniGen的新型扩散模型架构,旨在实现图像生成任务的统一。OmniGen模型以其统一性、简单性和知识迁移能力为特点,能够处理包括文生图...
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney,网友:一看就中国的
一个名为“red_panda”的神秘文生图模型近期在图像生成领域迅速走红,其ELO得分超过Flux 1.1 Pro高达100多分,胜率高达79%,且能在7秒内生成一张图像。这一表现...
Apple Intelligence 终于实装 iOS 18.1,用上的第一批用户已经开骂了?
Apple Intelligence 随着 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的更新正式推出,带来了多项重大更新,包括 AI 写作工具、照片记忆和 Siri 的升级。...
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
智源近日推出了OmniGen,这是一种新的扩散模型架构,旨在统一图像生成的多模态模型。OmniGen以其统一性、简单性和知识迁移能力为特点,支持多种图像生成任务...
苹果AI上线,ChatGPT免费用!首款M4 Mac诞生,库克:这是全世界最佳AI一体机
苹果公司近日宣布,随着iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1的更新,用户可以体验首批Apple Intelligence功能。这些功能包括全系统范围的写作工具、更...
座舱芯片夺冠后,芯擎点亮“星辰”
芯擎科技凭借其自动驾驶芯片“星辰一号”(AD1000)在中国自动驾驶芯片市场引起关注。该芯片在点亮测试中表现出色,12小时内核心系统功能全部验证通过,24小时...
谷歌、微软加入「AI 操控电脑」战场:谷歌版贾维斯将由Gemini 2.0加持
科技巨头们正将AI智能体操控电脑屏幕作为未来发展的重点。Anthropic展示了Claude 3.5能够自主看屏幕操作光标完成复杂任务。谷歌正在开发名为“Project Jarvis”...
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
智源研究院联合多所高校发布了超长视频理解大模型Video-XL,该模型利用语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,还在长视频理...