概括
在本文中,我将展示如何使用 Python 和自然语言处理构建知识图。
网络图是一种数学结构,用于显示点之间的关系,可以使用无向/有向图结构进行可视化。它是一种映射链接节点的数据库形式。
知识库是来自不同来源的信息的统一存储库,例如维基百科。
知识图是使用图结构数据模型的知识库。简而言之,它是一种特殊类型的网络图,显示现实世界实体、事实、概念和事件之间的定性关系。2012年,谷歌首次使用“知识图谱”一词来介绍他们的模型。
目前,大多数公司正在构建数据湖,这是一个中央数据库,他们在其中存储从不同来源获取的所有类型(即结构化和非结构化)的原始数据。因此,人们需要工具来理解所有这些不同的信息。知识图越来越流行,因为它们可以简化大型数据集的探索和洞察发现。换句话说,知识图连接了数据和相关元数据,因此可以用来构建组织信息资产的全面表示。例如,知识图可能会取代您为了查找特定信息而必须浏览的所有文档。知识图连接数据和相关元数据,因此可用于构建组织信息资产的全面表示。例如,知识图可能会取代您为了查找某个特定信息而必须浏览的所有成堆文档。
知识图被认为是自然语言处理领域的一