RAG从原理到应用,技术解析+实践拆解 RAG的4种基础范式: 基于查询的RAG:将用户查询与检索到的信息整合,直接输入到生成器的初始阶段 基于潜在表示的RAG:检索到的对象作为潜在表示整合到生成模型中,增强模型的理解和生成内容的质量 基于Logit的RAG:在解码过程中通过Logit整合检索信息 推测性RAG:使用检索代替纯生成,以节省资源并加快响应速度 RAG增强方法有五组方法来提升RAG系统的性能 输入增强 检索器增强 生成器增强 结果增强 整个流程的增强 大模型的局限性 幻觉问题 知识盲点 记忆力有限/长尾问题 时效性问题 数据安全问题 没有外部世界感知 无用户建模 RAG(检索增强生成)技术 传统的方式是问题通过解析后形成问题正文然后传导给大模型,大模型完成回答 RAG又称为“检索增强生成”。RAG流程,需要从整个流程来回溯一下: 1.首先用户提出问题,这个问题从始至终不会发生变化 2.然后我们需要理解用户的问题,知道用户提问的意图和方向 3.接下来就是我们需要根据用户的问题,去检索我们的知识库,找到与用户问题相关的信息,查找出与之相关的的文档或者文本内容 4.最后我们需要将这些文档或者文本内容进行整合,组成一个完整的提示词,提供给大语言模型用于生成 5.最后通过大语言模型生成相对精确的答案,返回给用户#AI大模型 #大模型微调 #大模型应用 #大模型训练 #RAG
作者:退休的老辰
音乐:@退休的老辰创作的原声一退休的老辰(原声中的歌曲:城北的花-王宇宙Leto/乔浚丞)
时长:00:23
评论数:15
点赞数:0.01万
分享数:15
收藏数:92
更新时间:2025年4月2日 19:56