免费AI“神器”系列第11弹:苹果版ChatGPT超越GPT-4;腾讯版Sora已获3000星|钛媒体AGI
文章摘要
【关 键 词】 AIGC、神器、苹果ReALM、腾讯AniPortrait、Polaris
生成式人工智能(AIGC)领域最近推出了多款新应用,钛媒体AGI整理了五款免费AI“神器”,每款都在其领域内展现了创新和潜力。
-
苹果ReALM:这是一款由苹果研究团队开发的设备端AI模型,参数量高达8亿,部分性能甚至超越了GPT-4。ReALM能够理解上下文关系,加快反应效率,并且适合在移动设备上运行。它可以帮助Siri更好地理解用户指令,甚至理解图像中的文字内容。尽管目前尚不清楚苹果是否会在其产品中实际使用ReALM,但预计在2024年的WWDC上会有更多信息披露。
-
腾讯AniPortrait:这是一个开源技术框架,可以通过一张人脸照片和音频生成高质量的视频。AniPortrait能够生成动态视频,保持面部表情流畅且口型一致。它的工作原理包括从音频中提取关键信息,然后通过处理层转换成三维面部模型,最后转换成二维点并结合Stable Diffusion 1.5生成连贯的肖像帧。尽管目前存在口型不够流畅的问题,但腾讯团队计划通过直接从音频预测视频生成来改进效果。
-
Polaris:由Hippocratic AI开发的Polaris是一款医疗保健大语言模型系统,能够为患者提供实时对话式的专业医疗咨询和指导。Polaris能够分析患者的实验报告和生命体征数据,提供个性化的饮食和营养建议。Polaris 2的表现在多个维度上与人类护士相当或更好,并且运行成本仅为人类护士的十分之一。
-
VideoSwap:这是一款由新加坡国立大学和Meta研究团队合作开发的视频编辑模型,可以在不改变视频背景和运动轨迹的情况下替换视频主体。VideoSwap使用少量语义点对齐物体运动轨迹并改变主体形状,再利用图像扩散模型确保视频生成结果的时间一致性。它已经通过大量测试,取得了SOTA成绩,成为目前最好的视频变换模型。
-
BasicPBC:文章并未提供关于BasicPBC的详细信息,但从标题“动画界‘神笔马良’”可以推测,这可能是一款能够创造或编辑动画内容的工具,具有一定的创新性和实用价值。
这些AI应用的推出不仅展示了AIGC领域的快速发展,也为用户提供了更多的选择和便利,同时也为未来的技术发展趋势提供了参考。
原文和模型
【原文链接】 阅读原文 [ 1420字 | 6分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 gpt-4
【摘要评分】 ★★★☆☆