大模型
LLM,VLM,模型
大模型时代Text-to-SQL技术在金融领域的实践
一、Text2SQL介绍Text2SQL(自然语言转SQL)技术将用户的自然语言文本转化为SQL语言,用于查询关系型数据库。该技术常被称为NL2SQL,其典型任务形式是将自然...
字节跳动正秘密研发多个AI产品
摘要:界面新闻报道称,字节跳动正在AI大模型领域秘密研发多个产品,包括多模态数字人产品以及AI生图、AI生视频产品等。据悉,字节跳动旗下剪映已组建封闭团...
创业者聊 Sora:可复刻吗、如何产品化、创业公司的机会在哪里?
2024年,Sora引起的关注与2023年GPT-4的发布相媲美,尽管尚未开放测试,但官方技术报告和生成的视频让人们对其技术路径有所了解。在Founder Park旗下的Global...
Text Inversion: 比 Lora 更简单地训练人脸【Stable Diffusion 炼丹教程】
本文详细介绍了如何使用Text Inversion方法训练Stable Diffusion模型,使其能够生成特定的人物图像。文章首先解释了Text Inversion的基本概念和优势,然后逐...
数量即力量!腾讯揭秘:Agent数量越多,大语言模型效果越好
本文介绍了腾讯研究者们在大语言模型(LLM)的可拓展性(scaling property)方面的新发现。研究者们通过简单的采样投票方法,证明了LLM的性能会随着实例化age...
反转?OpenAI:纽约时报「黑客攻击」了ChatGPT,要求驳回版权诉讼
摘要总结:去年,《纽约时报》对微软和OpenAI提起版权诉讼,指控它们在人工智能开发中违规使用《纽约时报》的内容。《纽约时报》提供了GPT-4输出与《纽约时报...
知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特
这篇文章介绍了谷歌新推出的开源模型系列「Gemma」,与之前的Gemini相比,Gemma更轻量且免费可用,同时模型权重也开源并允许商用。文章中提到了Gemma的两种模...
能看会说的人形机器人,对话的样子吓到我了
Ameca是英国Engineered Arts公司制造的人形机器人,最近进行了升级,现在不仅表情丰富,还能观察周围环境并与人交流。Ameca的说话能力是通过接入大型语言模型...
太炸裂了!阿里开发出 AI 图生视频模型EMO,“高启强”普法、蒙拉丽莎唱歌,B站鬼畜即将被AI取代|钛媒体AGI
阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图片-音频-视频模型技术,这是一种能够根据一张照片和音频文件生成会说话唱歌的AI视频的技术。EMO技术能够...
文生视频模型“卷”出新天际;多家手机厂商AlI in Al,终端AI时代来临?| 大模型一周大事
在过去一周,大模型行业迎来了多项重要进展。OpenAI发布的视频生成产品Sora成为焦点,预示着AI在视频制作领域的重大突破。Sora的发布不仅降低了视频制作的门...