by Wsnhg
(3)基于 InternLM 和 LangChain 搭建你的知识库_哔哩哔哩_bilibili
LLM 的局限
大模型开发范式
RAG:检索增强生成
flowchart LR
A1[用户输入] -- Sentence Transformer --> A2[向量化文本]
A2 -- Chroma向量数据库匹配 --> A3[相似文本段]
A3 --> A4[Prompt]
A1 --> A4
A4 -- LLM --> A5[最终输出]
LangChain - 开源框架,为LLM提供通用接口简化应用开发流程
flowchart LR
A[Local Docs] --> D
B[query] --> H
M --> C[answer]
subgraph ide1 [LangChain]
D["`**Text** generated by _UnstructedLoader_`"] --> E & L
E["`**Text chunks** generated by _TextSplitter_`"] --> F
F["`**Text embedding** generated by _SentenceTransformer_`"] --> G
G[(ChromaVectorDB)] --> I & K
H["`**Query embedding** generated by _SentenceTransformer_`"] --> I
I{"`_calculate similarity_`"} --> K
K{"`_fetch text chunks from embedding_`"} --> L
L{"`**prompt** from _prompt template_`"} --> M[LLM]
end
构建向量数据库
优化思路