配置知识图谱

创建知识图谱时,可以修改默认配置。 要开始流程并设置常规属性,请参阅在工程中创建调查

您可以配置知识图谱以允许用户编辑基础数据、配置知识图谱数据的管理方式并定义 Document 实体和 HasDocument 关系的支持方式。 也可以配置一些服务级别参数。 可配置的属性取决于您的软件版本以及知识图谱使用的是托管图谱存储还是 NoSQL 数据存储。

配置知识图谱

请按照这些步骤来配置知识图谱的操作和属性。 这些设置将存储为所创建的 ArcGIS Knowledge Server 服务定义的一部分。

  1. 在“创建调查”向导的定义知识图谱页面上,按照说明在常规选项卡中提供信息以使用默认配置创建知识图谱

    请记住在数据存储下的选择,因为这会影响您对知识图谱的配置。

  2. 单击配置选项卡。 如有必要,单击其下方的配置服务选项卡 配置服务
  3. 操作下,选中启用编辑复选框以启用知识图谱数据的编辑功能。

    知识图谱的所有者和门户管理员始终可以编辑其数据。 默认情况下,除非启用编辑功能,否则其他用户无法修改此知识图谱的数据。

  4. 选择允许具有足够权限的其他用户执行的编辑操作类型。

    这些编辑操作将在下面的表格中进行介绍:

    添加

    编辑者可以向知识图谱添加实体和关系。 他们可以定义新的属性类型和关系类型并添加属性。 通过在地图上创建实体,他们可以定义新实体的几何。 默认情况下,会启用该选项。 创建实体和关系后,必须为编辑者启用更新选项,以便他们修改实体和关系及其属性和几何。

    删除

    编辑者可以删除要素。 默认情况下,会启用该选项。

    更新

    启用此选项后,将默认启用属性和几何选项,由此允许编辑者更新实体和关系的属性以及实体几何。 选择仅限属性以仅允许编辑者更新现有实体和关系的属性。 他们无法修改现有实体的几何。

    如果在常规选项卡上选择了 NoSQL 数据存储,并且选择了用户管理数据选项,则此选项不可用。

    注:

    创建知识图谱后,即可Enterprise 门户中更改其编辑选项

  5. 数据存储下,选择知识图谱的 NoSQL 数据存储中数据的管理方式。

    如果在常规选项卡上选择了托管图谱存储选项,则此选项不可用。

    使用 ArcGIS Enterprise 11.1 或更高版本,您可以使用 Neo4j 数据库创建基于 NoSQL 数据存储的知识图谱。 可以将知识图谱配置为包含 Neo4j 数据库中 ArcGIS 管理和用户管理的数据。

    使用 ArcGIS Enterprise 11.2,您可以使用 ArangoDB 数据库创建基于 NoSQL 数据存储的知识图谱。 仅可以将知识图谱配置为包含 ArangoDB 数据库中 ArcGIS 管理的数据。

    ArcGIS 管理

    ArcGIS Knowledge 将创建、管理和删除实体和关系并定义 NoSQL 数据库中存储的图谱项目的数据模型。 不得在 Neo4jArangoDB 中直接编辑数据库。 默认情况下,会启用该选项。 如果您的 NoSQL 数据库为空,则只有使用此设置才能成功创建知识图谱。

    用户管理

    您必须创建、管理和删除实体和关系,并使用 Neo4j 定义图谱项目的数据模型。 当 ArcGIS Knowledge 访问 Neo4j 数据库时,知识图谱为只读状态。 Neo4j 数据库不是必须为空,但是数据库名称和数据模型类型及属性的名称必须满足所有命名限制

    注:

    此选项的默认设置为 ArcGIS 管理,使用该设置创建的知识图谱支持其他用户编辑知识图谱中的数据(根据之前步骤中指定的设置)。 但是,如果您选择用户管理选项,则知识图谱数据将为只读状态。 如果您之前已选中启用编辑选项,则该选项将自动取消选中,并且此选项卡上所有与编辑相关的选项将变为不可用。

  6. 配置知识图谱。

    根据将用于存储知识图谱内容的数据存储和该内容的管理方式,可用选项有所不同。 在某些情况下,您无法更改将使用的设置,但设置将保持可见,并指示配置知识图谱的方式。 选项将在下面的表格中进行介绍:

    唯一标识符

    知识图谱中的所有实体和关系必须具有可用于识别图谱项目的唯一字符串值。

    • 如果知识图谱的数据存储在托管图谱存储中,或者使用的是将包含 ArcGIS 管理数据的 NoSQL 数据存储,则此设置不可编辑。 所有实体类型和关系类型都将具有名为 globalid 的属性,用于存储唯一标识符。
    • 如果知识图谱将使用 NoSQL 数据存储,并且其中将包含用户管理的数据,则必须配置此设置。 指定 NoSQL 数据存储中用于存储此值的属性。 例如,如果数据库使用名为 id 的属性,则在唯一标识符文本框中输入此属性的名称。 在此示例中,知识图谱中的所有实体类型和关系类型都必须有一个名为 id 的属性。
    启用搜索

    所有知识图谱数据都可以通过 openCypher 查询访问。 但是,如果启用搜索,您只能使用针对其属性值的全文搜索来查找图谱项目。

    • 如果知识图谱的数据存储在托管图谱存储中,或者使用的是将包含 ArcGIS 管理数据的 NoSQL 数据存储,则此设置不可编辑。 在这些情况下,此选项被选中,且知识图谱支持搜索功能。
    • 如果知识图谱将使用 NoSQL 数据存储,并且其中将包含用户管理的数据,则默认情况下,将选中此选项,但可以更改此设置。 如果取消选中此选项并尝试搜索某个项目,则会使用 openCypher 查询来查找其属性包含指定值的图形项目。 但是,您将无法在搜索字符串中使用 Lucene 语法,包括 ORLIKE 等运算符。 此外,无法为部分关键字添加星号(例如 plan*),以利用词干提取或其他基于全文的搜索功能来匹配所有相关词。
    启用文档

    当知识图谱支持文档时,每个实体均可以关联具有支持材料的网站和文件,并且可以存储有关每个文档的信息的注释。 此选项指示是否可以将文档添加到知识图谱,以及文档是否不可编辑。

    • 如果知识图谱的数据存储在托管图谱存储中,或者使用的是将包含 ArcGIS 管理数据的 NoSQL 数据存储,则此选项被选中,并且支持文档。
    • 如果知识图谱将使用 NoSQL 数据存储,并且其中将包含用户管理的数据,则不会选中此选项,并且不支持文档。
    启用出处

    当知识图谱支持出处功能时,可以描述其信息的来源。 每个实体或关系属性值均可引用知识图谱中的文档、外部网站或文件,或者解释该值来源的文本。 此选项指示是否可以将出处添加到知识图谱。

    • 如果知识图谱的数据存储在托管图谱存储中,或者使用的是将包含 ArcGIS 管理数据的 NoSQL 数据存储,则默认情况下,不会选中此选项,但可以更改此设置。 如果选中此选项,则支持出处功能。
    • 如果知识图谱将使用 NoSQL 数据存储,并且其中将包含用户管理的数据,则无法编辑此设置。 此选项未被选中,不支持出处功能。

    注:

    创建知识图谱后,即可Enterprise 门户中更改其搜索和出处选项

配置参数

请完成以下步骤以配置知识图谱的参数。 这些设置将存储为所创建的 ArcGIS Knowledge Server 服务定义的一部分。

  1. 在创建调查向导顶部的配置选项卡下,单击配置参数 配置参数
  2. 属性下,为服务器返回的最大记录数指定一个值。

    此属性指定 openCypher 查询可以返回的图谱项目数或在调查、地图或链接图表中显示数据时显示的项目数。 数量过多可能会导致性能降低。 默认值为 10,000。

  3. 服务器在搜索操作期间返回的最大记录数指定值。

    此属性指定针对实体和关系的索引属性进行搜索时返回的图谱项目的数量。 数量过多可能会导致性能降低。 默认值为 2,000。

配置文档

请完成以下步骤以配置知识图谱中文档的表示方式。 这些设置将存储为所创建的 ArcGIS Knowledge Server 服务定义的一部分。

注:

如果知识图谱使用包含用户管理数据的 NoSQL 数据存储,则无法向其中添加文档。

了解有关文档的详细信息

  1. 在创建调查向导顶部的配置选项卡下,单击配置文档 文档
  2. 文档实体类型名称文本框中,输入数据模型中实体类型的名称,该类型表示知识图谱引用的文档。

    默认值为 Document。 如果使用默认值,当您向知识图谱添加文档时,将为 Document 实体类型创建一个新实体。 例如,如果所有文档都是照片,则可将此实体类型的名称更改为 Photo。

  3. HasDocument 关系类型名称文本框中,输入数据模型中关系类型的名称,该关系类型表示知识图谱中的实体和实体相关文档之间的关系。

    默认值为 HasDocument。 如果使用默认值,当您将文档添加到知识图谱中的特定实体(例如 Person 实体)时,将在 Person 实体和 Document 实体之间创建 HasDocument 关系类型的新关系。 如果您为用于存储文档的实体类型提供了自定义名称,则也可以更改此关系的名称。 例如,您可以将关系类型的名称更改为 HasPhoto。

  4. 也可以选择配置文档实体类型的定义方式。

    对于所有知识图谱中的所有文档,有一些信息是必填的或是我们强烈建议您填写的。 默认情况下,将为每个文档实体创建下方列出的一组属性,以便您提供此信息。 如果为这些属性提供自定义名称,则您在定义和浏览调查中的文档时,将会看到这些名称。

    text

    文档中的所有文本都将被提取并存储在此属性中。 默认属性值为 text。

    url

    文档的位置存储在此属性中。 该值可以是网站或 Internet 上提供的文档的 URL,或者是可用于访问网络上文档的文件路径。 默认属性名称为 url。

    关键字

    您可通过此属性指定有助于搜索文档的关键字。 默认属性名称为 keywords。

    name

    文档的文件名。 例如,如果您向知识图谱添加名为 notes.txt 的文件,则会存储文件名称。 默认属性名称为 name。

    contentType

    所引用文档包含的数据类型在此属性中存储为多用途 Internet 邮件扩展 (MIME) 类型。 例如,如果您向知识图谱添加了一个简单文本文件,则会记录值 text/plain。 默认属性名称为 contentType。

    title

    您可通过此属性为文档指定标题。 默认属性名称为 title。

    元数据

    您可通过此属性指定描述文档的元数据。 默认属性名称为 metadata。

    fileExtension

    当引用的文档为文件时,将记录文件扩展名。 对于网站,将存储文件扩展名 .htm。 默认属性名称为 fileExtension。

    创建知识图谱时,您提供的文本将用于标识文档实体类型的属性。

    当您添加文档时,会显示自定义属性名称。

配置出处

完成以下步骤以配置知识图谱中出处的存储方式。 这些设置将存储为所创建的 ArcGIS Knowledge Server 服务定义的一部分。

注:

如果知识图谱使用包含用户管理数据的 NoSQL 数据存储,则无法向其中添加出处。

了解有关出处的详细信息

  1. 在创建调查向导顶部的配置选项卡下,单击配置出处 出处
  2. 出处名称文本框中,输入将用于标识记录的名称,该记录定义知识图谱中存储的信息的源。

    默认值为“出处”。 例如,当您在目录窗格和目录视图中浏览调查的元类型时,会显示在此设置中提供的值,当您列出出处记录时,也会在调查的类型列中显示该值。

  3. 可以选择配置出处记录属性的定义方式。

    对于所有知识图谱中的所有出处记录,有一些信息是必填的或是我们强烈建议您填写的。 默认情况下会创建下方列出的一组属性,以便您为每个出处记录提供此信息。 如果为这些属性提供自定义名称,则您在定义和浏览调查中的出处记录时,将会看到这些名称。

    instanceID

    此属性存储与出处记录关联的实体或关系的全局 ID 值。 默认属性名称为 instanceID。

    sourceType

    与此出处记录关联的源材料类型存储在此属性中。 支持的源类型为文档、URL 和字符串。 默认属性名称为 sourceType。

    sourceName

    此属性提供源材料的名称。 当 sourceType 为文档时,此值设置为文档实体的名称属性。 当 sourceType 为 URL 或字符串时,您可以提供文本,例如网站的名称或受访人员的名称。 默认属性名称为 sourceName。

    此属性标识信息的源。 默认属性名称为 source。

    • 当 sourceType 为文档时,出处记录引用一个之前添加到知识图谱的文档。
    • 当 sourceType 为 URL 时,值可以是 Internet 上的网站或文档的位置,或是可用于访问网络上文档的文件路径。
    • 当 sourceType 为字符串时,值为文本,您可在其中提供信息或用于访问源材料的说明。
    评论

    您可通过此属性写入有关源材料的备注,或写入其与出处记录关联的实体或关系的相关性。 默认属性名称为 comment。

    typeName

    此属性存储与出处记录关联的实体或关系的类型。 例如,如果出处记录设置一个人的姓名,则将存储实体类型名称 Person。 默认属性名称为 typeName。

    propertyName

    此属性标识与出处记录关联的实体或关系的属性。 例如,如果出处记录确定了一个人的出生日期,则将存储属性名称 birthDate。 默认属性名称为 propertyName。

    创建知识图谱时,您提供的文本用于标识出处记录的属性。

    当您查看出处记录时,会显示自定义属性名称。

  4. 可以选择配置出处记录源类型的定义方式。

    定义出处记录时,支持使用三种源类型,如下所示。 如果为这些类型提供自定义名称,则您在定义和浏览调查中的出处记录时,将会看到这些名称。 这些 sourceType 值存储在出处记录的 sourceType 属性中。

    文档

    选择此类型时,出处记录会引用知识图谱中的文档。 此 sourceType 值的默认名称为“文档”。

    URL

    选择此类型时,出处记录存储源文档在 Internet 或网络上的位置。 此 sourceType 值的默认名称为“URL”。

    字符串

    选择此类型时,您可以输入信息、源本身的描述或用于访问源材料的说明。 此 sourceType 值的默认名称为“字符串”。

    创建知识图谱时,您提供的文本用于标识出处记录描述的源材料的类型。

    当您添加出处记录时,会显示自定义源类型名称。