“语音”的搜索结果

苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V
随着大模型的兴起,科技巨头和创业公司都在新一轮的技术竞赛中寻求优势。苹果公司,尽管长期处于行业领先地位,却在大模型领域显得稍有...
没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路
2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转...
即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多
上个月,彭博社报道了苹果公司正在与谷歌进行谈判,希望将谷歌的AI系统Gemini集成到iPhone中,以增强iPhone的AI功能。这一消息引起了业...
靠AI共情人类,这家公司刚融了3个亿
Hume AI公司近期推出了一款名为EVI(EmpatHic Voice Interface)的产品,这是一款能够通过分析人类的语音和声音来理解用户情绪的AI工具...
10年融资超1000亿,为何OpenAI能成为5700亿“巨兽”?|钛度图闻
OpenAI公司,以其生成式AI技术产品如ChatGPT和Sora,引领了新一轮的AI热潮。近期,OpenAI宣布ChatGPT免费开放给用户,并推出了新的语音...
Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话
腾讯最近开源了一个名为AniPortrait的新项目,它能够基于音频和一张参考图像生成高质量的动画人像。这个项目迅速在GitHub上获得了超过28...
AI下一个重大飞跃是理解情感!第一个具有情商的对话型AI来了
新智元报道了一家名为Hume AI的初创公司,该公司发布了一款被称为「第一个具有情商的对话式人工智能」的共情语音接口(EVI),它能够检...
李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席
李飞飞教授的计算机视觉课程CS231n在斯坦福大学再次开课,迎来了第九个年头。这门课程自2015年以来已成为计算机视觉专业学生的必修课,...
专访优必选庞建新:在大模型时代推动机器人智能化|GAIR live
未来几年,AI+人形机器人领域将迎来颠覆性的技术变革。庞建新,优必选副总裁、研究院副院长,正领导团队将大模型技术应用于人形机器人的...
天工 Sky Music 实测:做中文歌还得靠国产音乐大模型|AI 鲜测
近期,中国首个音乐大模型Sky Music引起了广泛关注。该模型基于昆仑万维的「天工3.0」超级大模型,采用自研类Sora模型架构,包含Large-s...
1 29 30 31 32 33 43