大模型
LLM,VLM,模型
音乐ChatGPT时刻来临!Suno V3秒生爆款歌曲,12人团队创现象级AI
AI初创公司Suno AI推出了V3音乐生成模型,能在几秒内创作出2分钟的完整歌曲,引起了网友的热议。该模型提供了更丰富的音乐风格和流派选项,如古典音乐、爵士...
CNN、Transformer、Uniformer之外,我们终于有了更高效的视频理解技术
视频理解技术旨在准确把握视频中的时空信息,但面临着短视频片段的时空冗余和复杂时空依赖关系的双重挑战。传统的三维卷积神经网络(CNN)和视频Transformer...
2024 全球开发者先锋大会开幕,探讨 AGI 与前沿技术
2024年全球开发者先锋大会(GDC)在上海成功举行,由上海市人工智能行业协会(SAIA)主办。本次大会以“模速空间——开发者的模力之源”为主题,聚集了全球开发者...
图解Transformer架构设计
近年来,Transformer技术在自然语言处理(NLP)领域引起了巨大关注。Transformer是一种新型架构,利用注意力机制显著提升深度学习NLP翻译模型性能。自从在论...
UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一
新智元报道了Anthropic公司推出的Claude 3模型,该模型在数据集跑分和用户体验方面均领先于GPT-4。尽管以往的新模型在跑分上超越GPT-4,但实际体验往往不如GP...
“硅谷创投教父”、沈向洋、徐立现身上海GDC大会,“群模乱舞”下中国 AI 大模型如何产生价值?|钛媒体AGI
2024年全球开发者先锋大会(GDC)在上海开幕,以“模速空间—开发者的模力之源”为主题,围绕大模型上下游产业链及应用场景进行深入探讨。大会期间,超过100个国...
OpenAI进军好莱坞:电影制作用Sora指日可待
文章摘要 【关 键 词】 OpenAI、视频生成、人工智能、好莱坞、合作关系 OpenAI最近展示了其自动生成视频的Sora,引起了好莱坞和硅谷的关注。 公...
女子早癌病变被漏诊,AI医生在X光中发现!谷歌最新AI听咳嗽就能检测新冠/结核
AI在医疗领域的应用越来越广泛,从诊断疾病到预测未来的疾病,AI都展现出了巨大的潜力。最近,AI在11名女性的乳腺X光检查中,成功地发现了被人类医生遗漏的乳...
复刻Sora的通用视频生成能力,开源多智能体框架Mora来了
何恺明的目标是探索面向复杂世界的智能。Sora是首个引起广泛关注的大规模通用视频生成模型,自OpenAI于2024年2月推出以来,没有其他视频生成模型能在性能或支...
GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成
这篇文章讨论了斯坦福大学的一项研究,指出在提交给人工智能(AI)会议的同行评审文本中,有6.5%到16.9%的文本可能是由大规模语言模型(LLM)大幅修改的,而...