图像生成
图像,绘画
数据即将耗尽?大型 AI 公司中没有人会感到恐慌
人工智能(AI)的发展在过去十年中取得了爆炸性的进展,这主要归功于神经网络规模的扩大和对大量数据的训练。然而,随着对数据的需求不断增长,AI研究人员正...
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与
多模态大模型(MLLM)在视觉理解领域取得了显著进展,其中视觉指令调整方法因其数据和计算效率而被广泛应用。Meta和纽约大学的合作论文探讨了大型语言模型(L...
全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉
智源研究院于2024年12月19日发布了下半年大模型综合评测结果,涉及100余个开源和商业闭源模型,覆盖文本、语音、图像和视频等多个领域。此次评测在5月的基础...
免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士
谷歌在其“Gemini 2.0 Flash Thinking”模型上取得了新进展,该模型以其卓越的推理能力而受到关注,能够通过“明确地展示自己的思维”来解决复杂问题,其水平与物...
豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠
豆包最新发布的“豆包·视觉理解模型”展示了其在图像识别和代码生成方面的强大能力。该模型能够识别APP截图,并迅速生成相应的代码,包括菜单栏、播放列表框架...
历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物
CMU联合20多所研究实验室开源发布了名为Genesis的生成式物理引擎,标志着我们向构建一个综合生成文本、图像、音频、视频和3D对象的世界迈出了重要一步。Genes...
GitHub Copilot扛不住Cursor的竞争,终于推出了免费版本
GitHub Copilot 近日宣布对所有 VS Code 用户提供免费计划,用户只需拥有 GitHub 账户即可享受服务,无需试用、订阅或信用卡信息。该平台开发者数量已突破1.5...
重磅!OpenAI开放满血o1模型API,成本暴降60%
OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...
继续对着OpenAI来,Google发布Veo 2、Imagen 3,Sora和DALL-E不香了
本周,OpenAI和Google在人工智能领域再次展示了他们的竞争态势。OpenAI的焦点是ChatGPT Search的更新,其中包括搜索功能的优化、视觉效果的增强、移动端地图...
从骁龙8至尊版,我看到了AI手机的未来 | 智在终端
2024年最后一季度,安卓市场因骁龙8至尊版的发布而再次火热。AI成为手机市场的核心关键词,各大厂商通过实际进展证明端侧AI已成为手机竞争的新焦点。骁龙8至...