北京大学(天津)新一代信息技术研究院

问途

集自动化构建、高性能存储与语义分析于一体的大规模知识图谱平台。

首页 > 垂域大模型平台 > 问途

平台介绍

“问途”定位为面向海量异构数据的大规模知识图谱平台,通过结构化方式建模概念、实体及其关系,帮助用户更好地组织、管理与理解复杂信息,并将知识以易于接受的形式传递给业务用户。平台聚焦“精准抽取—自增长构建—高效检索—语义融合—高性能存储”的全流程能力,一方面以自动化与增量化机制降低图谱构建与更新的人力成本;另一方面以秒级检索、可视化分析与推理支持,服务网络安全、城市政务、金融风控等典型场景的知识检索、关联探寻与决策分析需求。

核心功能

知识建模与表示

  • 统一知识组织以概念、实体、关系为核心的图谱建模框架,面向不同应用场景提供可扩展的知识表示与管理能力。
  • 多源异构接入支持从关系数据库、半结构化资源与文本数据中构建实例知识,为后续检索、融合与推理提供统一底座。

知识精准抽取(文本实体与关系抽取)

  • 人机协同两阶段抽取集成多模型协同推理与LLM集成学习方法,提升复杂文本的抽取精度。
  • 主动学习降标注成本通过交互式主动学习最小化人工标注量,支持模型自动训练、快速更新与高效部署。
  • ModelOps全生命周期管理以模型管理机制支撑模型构建、复用、迁移与迭代,形成可复用的模型库能力。

图谱构建演化(自增长自演化)

  • 本体引导的模式匹配结合多种相似度的“本体模型—库表模式匹配”算法,实现增量式概念模型与数据模式的智能映射。
  • 增量发现与自动更新面向数据持续变化场景,引入增量自动发现机制,支持实例模型自增长与图谱持续演化。
  • 可视化映射编辑提供多种可视化方式呈现复杂映射关系,并利用人工反馈迭代优化推荐算法。

图谱高效检索与自然语言问答

  • 自然语言到图查询基于LLM理解用户意图,自动生成图查询语言并执行,降低非专业人员使用门槛。
  • 秒级大图检索支持亿级节点、十亿级边规模的检索与模式匹配式自定义查询,满足高并发分析需求。
  • 结果智能呈现对查询结果类型进行识别,自动渲染更合适的展示方式,支撑递进化、层次化的知识呈现。

图表联合存储与超级节点管理

  • 图表混合存储融合图数据库与文档型数据库优势,兼顾高效导入、检索与统计分析。
  • 超级节点高效管理面向单节点千万级边的极端场景,通过谓词合并与“只读必要数据”等策略提升单跳检索性能。
  • 高性能工程指标在导入、单跳检索与统计分析等任务上,相较主流纯图方案实现显著性能提升,支撑百亿级数据规模扩展。

核心创新点

主动学习×LLM×ModelOps的一体化知识抽取

以交互式主动学习降低标注成本,以多模型协同与LLM提升抽取精度,并通过ModelOps实现可复用与可持续迭代。

本体引导的增量映射与图谱自增长

通过模型—模式智能映射与增量自动发现机制,将“构建一次”升级为“持续演化”,显著降低更新维护成本。

图表混合存储的超大规模检索能力

面向超级节点与超大规模数据,结合混合存储、查询语言封装与工程级优化,兼顾性能、兼容性与易用性。