大模型
LLM,VLM,模型
透过科大讯飞的“AI+”行业实地战,看中国新质生产力变革的未来之路
人工智能+(AI+)在2024年两会中首次被写入政府工作报告,标志着国家将加强顶层设计,加速形成以AI为引擎的新质生产力。全国人大代表、科大讯飞的董事长刘庆...
深入理解Sora技术原理|得物技术
视频生成时,获取随机噪声视频,通过训练的视频压缩网络,将噪声视频压缩成低维度的潜在空间数据,以便更好的处理视频数据。将压缩后的潜在空间数据分解成空...
独家支持MoE大模型一键训练,达观大模型管理平台两大全新功能发布
达观大模型管理平台推出曹植MoE模型达观大模型管理平台(DATAGRAND)推出了支持中文的曹植MoE模型,以满足用户多样化的模型管理需求。曹植MoE模型具有更大的...
首个AI程序员:能接单干私活,自动微调大模型!
文章介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的主题。其中,AI初创公司Cognition发...
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力
这篇文章介绍了一项由西安交通大学、中国科学技术大学、清华大学和微软亚洲研究院的学者共同完成的研究工作,名为Xwin,旨在探索通用预训练下规模为7B的语言...
4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
Cerebras宣布推出了历史上最重要的消息,发布了拥有高达4万亿个晶体管的WSE-3芯片,是世界上最快的芯片之一。该公司一直致力于开发大型芯片,之前发布的WSE-1...
智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏
这篇文章报道了谷歌 DeepMind 最新的研究成果:他们开发了一种名为SIMA(Scalable Instructable Multiworld Agent)的通用AI智能体,适用于3D虚拟环境。SIMA...
零一万物API正式上线:支持输入30万汉字,看不懂《百年孤独》的人有救了
步骤2:内容摘要零一万物正式发布了Yi大模型API开放平台,提供了三个模型:Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能。Yi-34B-Chat-200K:20...
让Sora和ChatGPT更可靠!只需这个知识价值定量评估新框架
这篇文章讨论了如何将人类知识注入大型AI模型以提高其效率和推理能力。为了解决数据和知识对模型的影响平衡问题,美国国家工程院院士张东晓和宁波东方理工大...
OpenAI大模型上身机器人,原速演示炸场!
这篇文章介绍了一款名为Figure 01的机器人,它是由OpenAI大模型加持的,具备听、说、动作灵活等功能。机器人可以描述眼前的场景并做出相应反应,比如听到人类...