免费AI“神器”系列第11弹：苹果版ChatGPT超越GPT-4；腾讯版Sora已获3000星｜钛媒体AGI

AIGC动态1年前 (2024)发布 TMTPOSTAGI

3,117 0 0

免费AI“神器”系列第11弹：苹果版ChatGPT超越GPT-4；腾讯版Sora已获3000星｜钛媒体AGI

文章摘要

【关键词】 AIGC、神器、苹果ReALM、腾讯AniPortrait、Polaris

生成式人工智能（AIGC）领域最近推出了多款新应用，钛媒体AGI整理了五款免费AI“神器”，每款都在其领域内展现了创新和潜力。

苹果ReALM：这是一款由苹果研究团队开发的设备端AI模型，参数量高达8亿，部分性能甚至超越了GPT-4。ReALM能够理解上下文关系，加快反应效率，并且适合在移动设备上运行。它可以帮助Siri更好地理解用户指令，甚至理解图像中的文字内容。尽管目前尚不清楚苹果是否会在其产品中实际使用ReALM，但预计在2024年的WWDC上会有更多信息披露。
腾讯AniPortrait：这是一个开源技术框架，可以通过一张人脸照片和音频生成高质量的视频。AniPortrait能够生成动态视频，保持面部表情流畅且口型一致。它的工作原理包括从音频中提取关键信息，然后通过处理层转换成三维面部模型，最后转换成二维点并结合Stable Diffusion 1.5生成连贯的肖像帧。尽管目前存在口型不够流畅的问题，但腾讯团队计划通过直接从音频预测视频生成来改进效果。
Polaris：由Hippocratic AI开发的Polaris是一款医疗保健大语言模型系统，能够为患者提供实时对话式的专业医疗咨询和指导。Polaris能够分析患者的实验报告和生命体征数据，提供个性化的饮食和营养建议。Polaris 2的表现在多个维度上与人类护士相当或更好，并且运行成本仅为人类护士的十分之一。
VideoSwap：这是一款由新加坡国立大学和Meta研究团队合作开发的视频编辑模型，可以在不改变视频背景和运动轨迹的情况下替换视频主体。VideoSwap使用少量语义点对齐物体运动轨迹并改变主体形状，再利用图像扩散模型确保视频生成结果的时间一致性。它已经通过大量测试，取得了SOTA成绩，成为目前最好的视频变换模型。
BasicPBC：文章并未提供关于BasicPBC的详细信息，但从标题“动画界‘神笔马良’”可以推测，这可能是一款能够创造或编辑动画内容的工具，具有一定的创新性和实用价值。