“实时翻译”的搜索结果

杀疯了!地表最强模型GPT-4o登场,速度提升200%、价格便宜50%,或将颠覆实时翻译等行业|钛媒体AGI
美国OpenAI公司在5月14日的春季ChatGPT发布会上推出了全新的旗舰AI模型GPT-4o,该模型能够实时进行音频、视觉和文本推理。GPT-4o的发布...
Meta 眼镜支持多模态 Llama 3,实时翻译、物体识别,AI 眼镜的机会来了!
Meta官方宣布,其智能眼镜产品现已支持多模态版的Llama 3,这一功能在开源版本中尚未实现。这款眼镜具备音乐播放、语言翻译、发送语音信...
OriginOS 5将手机AI“拖入”新时代
科技行业的大语言模型AI技术正在深刻改变多个行业,其中vivo的OriginOS操作系统是一个突出的例子。自2020年底推出以来,OriginOS以其设...
我用豆包,生成了AI版《红楼梦》MV
字节跳动公司近期推出了一系列先进的AI视频生成模型,包括PixelDance和Seaweed模型,这些模型因其出色的效果而受到广泛关注。为了测试这...
地表最强全息AR眼镜问世!Meta十年绝密豪赌烧10亿,现场开箱老黄亲测
Meta公司在2024年的Meta Connect大会上展示了其首款AR眼镜Orion,标志着公司在元宇宙领域的进一步发展。Orion眼镜的研发历时十年,投入...
全面AIGC时代,豆包模型家族准备好了
火山引擎在AI领域的发展速度迅猛,短短几个月内,其豆包大模型家族已经发展到13款模型,覆盖文本、语音、图片、音乐、视频等多个模态,...
后发先至,字节版 Sora 发布!10秒长度、多主体交互、一致性多镜头
字节跳动公司近期发布了豆包大模型的多款新品,标志着其在人工智能领域的进一步拓展。这些新品包括视频生成、音乐生成和同声传译大模型...
阿里通义上新PPT创作!PC端“效率”功能三合一,听读写一站搞定
通义千问大模型2.5最近推出了一项新功能——PPT创作,旨在帮助用户更高效地制作演示文稿。这项功能包含两种制作方式:一种是通过一句话主...
终于来了,OpenAI测试GPT-4o高级语音模式!
OpenAI正在对GPT-4o的高级语音模式进行测试,目前仅向部分ChatGPT Plus用户开放。测试的目的是收集关于安全性和功能方面的反馈,以便在8...
微软宣布GPT-4o模型,可在 Azure OpenAI上使用
模型发布与应用平台:微软在官网宣布,OpenAI的多模态模型GPT-4o已在Azure OpenAI云服务中可用。GPT-4o能够进行跨文本、视频、音频的多...
1 2