视频生成
视频,video
张雪峰,杀死理想,盆满钵满
每年毕业季,数百万高考考生和家长面临志愿填报的焦虑和迷茫。随着高考成绩的公布,市场上各种付费志愿填报机构开始活跃起来。张雪峰及其公司“峰学蔚来”在这...
AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题
视频创作在AIGC时代迎来了全新的变革。通过AI技术,视频创作变得更加简单和高效。例如,用户可以轻松地将目标对象从视频中分离出来,并嵌入不同的背景视频中...
8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功
法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...
现场Live震撼!OmAgent框架强势开源!行业应用已全面开花
联汇科技作为大模型行业的领军企业,其发展历程与自动驾驶技术的演变颇为相似,均经历了从概念到现实的转变,并在技术产品创新和用户体验上不断取得突破。公...
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
商汤科技在世界人工智能大会上发布了国内首个流式原生多模态交互模型——日日新5.5系列中的5o。这一模型整合了文本、声音、图像和视频等多种模态,能够实现实时...
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
新智元报道了AI视频生成技术在二次元领域的新突破,特别是一款名为YoYo的创作网站,为动漫爱好者提供了一个简单易用的平台。用户通过文字提示或上传图片,即...
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好!
Kyutai,一个由8人组成的非营利性AI研究实验室,在短短6个月内开发出了一种名为'Moshi'的实时原生多模态基础AI模型。Moshi能够表达70多种情绪,以不同风格说...
钛媒体AGI对话MiniMax创始人闫俊杰:至少三年后才会出现“杀手级”AI应用|直击WAIC 2024
他指出,尽管国内许多公司正在追赶ChatGPT,但目前模型的错误率在60%-70%,远高于GPT-4的30%-40%。因此,降低大模型的错误率是核心问题,而提高训练效率、研...
中国生成式AI专利38,000个,是美国6倍、超过全球总和!
联合国于2024年7月4日发布的深度调查报告揭示了中国在生成式人工智能(AIGC)领域的显著领先。2014至2023年间,中国申请的AIGC专利数量高达38,210项,是美国...
阶跃星辰官宣 Step 系列大模型全面升级,万亿+多模齐发
在2024年世界人工智能大会暨人工智能全球治理高级别会议上,阶跃星辰发布了三款新的Step系列通用大模型:Step-2万亿参数语言大模型正式版、Step-1.5V多模态大...