招采问答大模型
具备RAG技术的招采大模型,实现知识库自动构建、智能问答、精准溯源及动态更新,有效解决传统招采效率低、溯源难等痛点,赋能招采业务数智化转型。
首页 > 解决方案 > 领域解决方案 > 政务 > 招采问答大模型
平台介绍
在数字化转型加速推进的背景下,招采领域对高效、智能的信息处理与知识服务需求日益迫切。传统招采业务中,知识库构建效率低、知识问答精准度不足、信息溯源困难及知识库内容更新滞后等问题,制约了招采工作的智能化水平。为解决上述痛点,本项目聚焦招采场景核心需求,研发具备 RAG 知识库自动构建、智能知识问答、问答溯源及知识库联网拓展功能的招采大模型,助力提升招采业务的数字化、智能化水平,为招采决策提供高效支撑。
功能介绍
RAG知识库自动构建
- 非结构化文档解析:深度解析PDF、Word等复杂文档,通过OCR与版面分析技术,将混乱数据转化为机器可读的清洁文本。突破传统文档解析仅提取文本的局限,融合视觉布局分析与自然语言理解技术,实现复杂格式文档的深度解析。
- 基于T-Doc的文档结构自动拆解:利用T-Doc技术智能识别文档层级与版面布局,精准拆解标题、表格与段落,实现机器对文档逻辑结构的深度理解与重组。突破文档物理结构限制,构建符合招采业务逻辑的树型知识结构
- 自适应滑动窗口文档语义切片:通过动态调整窗口大小智能捕捉上下文,将长文档切分为语义完整的片段,在突破模型长度限制的同时,确保段落语境的连贯性。摒弃传统固定长度切片导致的语义断裂问题,采用自适应滑动窗口算法,结合招采文本的语义特征动态调整切片长度。
- 语义切片向量化服务:将文本片段转化为计算机可理解的高维向量,捕捉深层语义特征,为后续实现高效的语义检索与相似度计算提供核心算力支撑。采用“问智”团队优化的Sentence-BERT中文预训练模型(针对招采领域语料微调),将语义切片转化为高维向量,捕捉招采专业术语的深层语义特征
RAG大模型知识问答
- 多轮知识问答:通过维护对话上下文记忆,精准理解用户的连续追问意图,实现流畅自然的类人交互体验,高效解决复杂的深度咨询需求。突破传统单轮问答的局限,通过动态上下文记忆机制,实现招采领域复杂问题的多轮深度交互。
- 用户意图识别:利用大模型技术理解用户背后的真实需求与查询动机,对查询进行改写以提升大模型知识问答准确性。针对招采业务中用户提问模糊(如“我能参与这个项目吗”)的问题,采用“问智”团队的基于问题模型的主动提问技术,实现用户意图的精准识别与澄清。
- 知识冲突化解:针对知识库中多源信息中可能存在的矛盾内容,通过Know-PO知识偏好优化技术,另大模型具有筛选最有结论的能力、提升输出准确性。采用“问智”团队的Know-PO(Knowledge-aware Preference Optimization)知识感知偏好优化技术,实现冲突知识的智能筛选。
知识问答溯源
- 向量空间最近邻检索引擎:在海量知识库中实现毫秒级的高维数据匹配,快速精准锁定与问题最相关的语义内容,大幅提升信息检索的效率与准确率。采用“问智”优化的FAISS 向量检索引擎,结合招采知识的多粒度特征,实现毫秒级、高精准度的知识召回。
- 溯源答案展示:生成回答时自动关联并展示引用的原文出处,方便用户验证信息真伪,解决大模型“黑盒”问题,显著增强系统的可信度。突破传统溯源仅标注“出处文档名”的局限,实现“答案-知识单元-原文片段”的三级溯源展示,方便招采用户验证信息真伪。
知识库联网拓展
- 大模型联网工具调用:赋予模型连接互联网获取实时信息及调用外部API的能力,突破知识库内容约束和知识时间截止限制。基于LangChain框架集成联网检索工具与API调用能力,实现大模型在内部知识不足时的自动联网补充。
- 网络开放数据与知识库信息融合检索:整合内部私有知识库与外部互联网公开数据,通过互补融合检索,消除信息孤岛,为用户提供兼具深度与时效性的全方位信息服务。采用“问智”的多源数据融合算法,将内部知识库与外部联网数据进行深度整合,避免信息孤岛与重复冗余
关键技术
文档解析技术
采用Apache Tika结合Tesseract OCR 引擎,实现PDF、Word等文档的文本提取及图片格式文档的 OCR 识别,搭配版面分析算法,精准识别文档标题、段落、表格等结构元素。
T-Doc文档结构拆解技术
基于深度学习的文档结构识别模型,自动解析文档目录层级与版面布局,生成树状结构化数据,实现文档逻辑结构的深度理解与重组。
语义切片技术
采用自适应滑动窗口算法,结合Transformer模型的语义理解能力,动态调整窗口大小,确保切片文本的语义完整性,突破大模型长度限制。
向量化技术
选用Sentence-BERT预训练模型,将文本切片转化为高维向量,捕捉深层语义特征,为高效向量检索提供支撑。
向量检索技术
采用FAISS向量检索引擎,构建高效的向量索引,支持毫秒级最近邻检索,确保问答溯源的快速性与准确性。
大模型技术
基于开源大模型(如 Llama 3 70B)进行微调,优化招采领域专业知识问答能力,结合Prompt Engineering实现意图识别与知识冲突化解。
联网工具调用技术
采用LangChain框架集成联网检索工具,实现自动触发网络搜索、API调用功能,支持外部数据的实时获取与整合。
Web开发技术
前端采用Vue3+ Element Plus框架,开发用户友好的交互界面;后端采用Python + FastAPI框架,实现高效的接口开发与服务部署。
数据库技术
采用PostgreSQL存储结构化文本、用户信息、操作日志等数据,搭配pgvector插件支持向量数据存储与检索;采用 MinIO存储原始文档与备份数据。
落地案例


