“讯飞星火”的搜索结果

最长处理2小时,开源视频字幕模型Video ReCap
本文介绍了北卡罗来纳大学和Meta AI研究人员开源的视频字幕模型Video ReCap。该模型能够处理长达2小时的视频,并在多个层级上生成字幕。...
ChatGPT编程时代来啦,GitHub Copilot Enterprise正式发布!
GitHub Copilot Enterprise是全球最大开源平台之一GitHub发布的新工具,旨在提高开发人员的编码效率。该工具基于OpenAI的GPT-4模型,并...
微软与OpenAI竞争对手Mistral AI,达成技术合作
本文介绍了微软与开源大模型平台Mistral AI的技术合作,以及Mistral AI在AIGC领域的最新发展。首先,微软将通过Azure云服务为Mistral AI...
OpenAI推出“Meta-Prompting”,显著提升GPT-4等模型内容准确性
本文介绍了一个名为Meta-ProMetating(简称“Meta”)的创新大模型增强框架,由OpenAI和斯坦福大学的研究人员共同推出。Meta旨在提升GPT-4...
Sora抢饭碗!好莱坞大亨停止,8亿美元投资
本文介绍了AIGC领域的专业社区,关注大语言模型(LLM)的发展和应用,特别是OpenAI发布的文生视频模型Sora。好莱坞著名演员Tyler Perry...
200万上下文,超谷歌 Gemini 1.5!微软开源LongRoPE
文章主要介绍了微软研究推出的LongRoPE框架,该框架成功地将大语言模型的上下文扩展至200万,超过了谷歌Gemini 1.5的100万token上限。Lo...
创新性3D数据合成模型,微软推出EgoGen
本文介绍了微软和苏黎世联邦理工学院研究人员共同开发的EgoGen模型,这是一个用于生成第一视角训练数据的工具,旨在解决AR/VR等设备在第...
Stable Diffusion 3来啦!提示文本理解更好,图像质量更强
本文介绍了专注于AIGC领域的专业社区,关注大语言模型(LLM)的发展和应用落地。2月23日,stability.ai推出了Stable Diffusion 3,该版...
为什么号称模拟世界的Sora,处理不好一些简单的物理规律?
本文讨论了AIGC领域的专业社区,特别是关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。文章以Sora视频...
谷歌掀桌子!开源Gemma:可商用,性能超过Llama 2!
2月22日,谷歌宣布开源了大语言模型Gemma,该模型与谷歌最新发布的Gemini使用相同架构,提供20亿和70亿两种参数版本。Gemma在多个主流测...
1 6 7 8 9 10