大模型

LLM,VLM,模型

49152 个GPU!Meta最新算力集群曝光,扎克伯格:算力,算力,还是 Meta 的算力

Meta最近披露了两个新的GPU集群,用于训练下一代生成式人工智能模型,包括即将推出的Llama 3和其他领域的人工智能研究与开发。这两个集群在硬件、网络、存储...

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

新智元报道了一种新型强化学习框架StepCoder,由复旦大学、华中科技大学和皇家理工学院的研究人员共同提出。StepCoder旨在解决大型语言模型(LLMsCCCS);2) ...

仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

新智元报道了Google Research的研究人员提出了一个时序预测基础模型TimesFM,该模型针对时序数据设计,输出序列长于输入序列。TimesFM在1000亿时间点数据上进...

GPT-5临近上线,中美AI差距悬殊?这个国产方案「弯道超车」抢先狙击

GPT-5和GPT-4.5的传言满天飞,人们对OpenAI发布新模型充满期待。同时也有人质疑,国内外差距是否在拉大。但事实上,在大模型的行业应用落地方面,中国很可能...

又双叒一轮亿元融资,到底谁是中国版Sora?

这篇文章介绍了中国文生视频公司在Sora发布强大逼真的文生视频后的最新动态。首先,七火山科技发布了Etna模型,实现了4K分辨率和60帧每秒的超高流畅度,成为...

智谱AI给中国大模型公司的商业化打了样

智谱AI,一家由清华大学知识工程实验室孵化的人工智能公司,已经在人工智能领域取得了显著的成果。在2023年,该公司累计获得超过25亿元的融资,成为国内估值...

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...

美团龙珠,投了最火90后

模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★   文章摘要 【关 键 词】 月之暗面、A轮融资、美团龙珠、...

透过科大讯飞的“AI+”行业实地战,看中国新质生产力变革的未来之路

人工智能+(AI+)在2024年两会中首次被写入政府工作报告,标志着国家将加强顶层设计,加速形成以AI为引擎的新质生产力。全国人大代表、科大讯飞的董事长刘庆...

深入理解Sora技术原理|得物技术

视频生成时,获取随机噪声视频,通过训练的视频压缩网络,将噪声视频压缩成低维度的潜在空间数据,以便更好的处理视频数据。将压缩后的潜在空间数据分解成空...
1 308 309 310 311 312 393