1.说明

RAG结合LLM(通用大预言模型)构件基于私有文档、专业领域知识、实时信息的charbot。

2.RAG的主要步骤

  • 知识切片成chunk
  • 向量化chunk入库
  • query检索知识chunk
  • 构件prompts
  • 调用llm生成回答

3.优势

  • 快速构件demo
  • 快速理解rag
  • 社区支持

4.痛点

  • 投入大
  • 效果差
  • 调优难

5.RAG应用的效果

整体效果=文档处理效果*embedding效果*retrieval效果*LLM效果

6.数据处理的难点:解析和拆分

1.PDF格式的多样性(eg:标准格式、跨页表格、离散等),会有复杂多变的文档格式,提高效果的困难度。

解决办法:

腾讯云向量数据库-RAG介绍-LMLPHP

2.文档内容质量将很有程度影响最终效果。

腾讯云向量数据库-RAG介绍-LMLPHP

04-13 11:29