标签:AIGC
微软开源视觉GUI智能体:增强GPT-4V能力,超3800颗星
微软研究人员开发了一款名为OmniParser的开源视觉GUI智能体,旨在提升大语言模型(LLM)如GPT-4V在用户界面(UI)识别和操作任务中的表现。OmniParser通过将U...
超越Sora!全球首个带背景音乐,文生1080超高清视频模型
Meta公司推出了一款名为Movie Gen的大模型,标志着其正式进入文本生成视频(AIGC)领域。该模型拥有300亿参数,能够以每秒16帧的速度生成16秒长的1080P超高清...
北大陈宝权教授:从图形计算到世界模型
北京大学陈宝权教授在第九届计算机图形学与混合现实研讨会(GAMES 2024)上发表了题为《从图形计算到世界模型》的报告,探讨了图形计算与世界模型之间的内在...
IBM开源新模型,可完美、快速转换PDF文档格式
在AIGC领域,PDF文档的转换一直是一个技术挑战,因为PDF文件在格式、标准化和结构上存在显著差异。IBM的研究人员开发了Docling模型,这是一个基于PDF解析器、...
ChatGPT成精了!居然主动勾引用户,OpenAI又测试新功能?
在AIGC领域,专业社区密切关注着大型语言模型(LLM)的发展和应用,特别是微软、OpenAI、百度文心一言、讯飞星火等公司的产品。近期,有用户报告称他们收到了...
谷歌发布Imagen 3,超过SD3、DALL・E-3
谷歌DeepMind发布的Imagen 3模型在文本到图像生成领域取得了显著进步,相较于前代产品及同类产品展现出了卓越的性能。Imagen 3采用了潜空间扩散模型技术,这...
字节最吸金的海外AI应用:月活超3亿,一年狂揽1.25亿美元
字节跳动的海外AI视频编辑应用CapCut自2020年推出以来,月活用户数已超过3亿,占移动视频编辑总活跃用户的81%。CapCut是剪映的海外版,与TikTok形成互补,借...
阿里开源新模型:超GPT-4o,数学能力全球第一!
阿里巴巴集团开源了一款名为Qwen2-Math的最新数学模型,该模型包含1.5B、7B和72B三种参数规模的版本,旨在推动AIGC领域的专业社区发展。Qwen2-Math在多个数学...
OpenAI掀桌子!免费提供GPT-4o mini微调,每天200万tokens
AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。OpenAI宣布在特定时间内为4级、5级用户提供GPT-4o min...
大模型风口下,卷应用才有价值!首期 AIGC 实践案例集锦上线啦(免费下载)
2024年,生成式AI技术已经从技术探索阶段过渡到应用实践阶段。全球范围内的头部AI公司,如OpenAI、谷歌、苹果,以及中国的百度、阿里云、字节跳动、腾讯等科...