1.主要流程:

  1. 用户提问

  2. 输入护栏(安全过滤、隐私脱敏、Token 截断)

  3. 记忆检索(根据问题,去长期记忆中捞取用户画像或历史相关上下文)

  4. 意图识别与路由(程序+小模型判断:是闲聊、查库、还是操作?)

  5. 查询重写/优化(把口语转化为搜索关键词或 API 参数)

  6. 工具调用与循环执行(ReAct 模式:思考->行动->观察->再思考,直到任务完成)

  7. 结果组装(把工具返回的数据、检索到的文档、系统指令拼成 Final Prompt)

  8. 大模型生成(根据 Prompt 生成自然语言回答)

  9. 输出护栏(关键补充:检查幻觉、敏感词、合规性。如果不合格,拦截或重写)

  10. 响应与反馈闭环(返回给用户,同时异步记录日志,收集反馈用于后续优化)

流程图:

示例: