向知识图谱添加文档

可以从知识图谱中引用文档,为其参与的实体或关系提供背景,支持存储在实体属性中的事实,并提供权威的信息源。 知识图谱中的文档是对其存储位置中的文件或者 Internet 上可用的网站或文档的引用。

默认情况下,每个知识图谱都具有一个 Document 实体类型和一个 HasDocument 关系类型。 向知识图谱添加文档时,将为 Document 实体类型创建一个新实体。 例如,向表示人员或车辆的特定实体添加文档时,将从车辆实体到文档实体创建 HasDocument 关系。 一个文档可以被许多实体引用。

在调查中查看实体的详细信息时,其文档将在文档选项卡上列出。 该实体与其文档之间的 HasDocument 关系以及该实体参与的任何其他关系也会在关系选项卡上列出。 访问相关文档的方式与从详细信息面板访问其他相关实体的方式相同。

某些功能适用于其他实体类型不可用的文档。 可以在预览选项卡的详细信息面板中预览诸如图片等文件和网站。 可以在与本地计算机上的文件类型相关联的应用程序中打开其他文件(例如 Microsoft Word 文档)。 对于诸如文本文件、演示文稿和网站等文档,将提取文本并为其创建索引以支持知识图谱中的搜索。 可以在详细信息面板的文本选项卡上预览和修改文档的文本。 可以在知识图谱中创建新文档以捕获与调查相关的注记。

注:

如果知识图谱使用包含用户管理数据的 NoSQL 数据存储,则不支持引用文档。 文档选项卡不会显示在实体和关系的详细信息面板上。

向实体添加文档

可以向实体添加文档以支持您的调查并澄清细节。 可以从本地网络添加文件,或者通过提供 URL 来引用网站。

添加文件

可以引用存储在本地计算机或网络上的文件作为知识图谱中的文档。 使用其路径来访问该文件。

如果从磁盘添加文件,并且通过驱动器号(例如 C:\Data)访问该磁盘,则当许多用户使用相同的知识图谱时,他们将无法访问存储在计算机上的文件。 更好的做法是通过提供相应位置的 UNC 路径或 URL 来引用该文档,每个使用知识图谱的用户都可以从该位置访问此文件,例如在 Microsoft OneDriveMicrosoft SharePoint 中共享的文档的 URL。

  1. 单击与该文档相关联的调查中的所有实体。
  2. 在调查的详细信息面板中,单击文档选项卡。
  3. 单击添加...添加 然后单击菜单上的添加 添加

    随即显示添加文档对话框。

  4. 浏览至相应文件并将其选中,然后单击确定

将在知识图谱中创建一个新的 Document 实体,该知识图谱在所选文件的存储位置处引用该文件。 将在调查中选择的所有实体和该文档之间创建 HasDocument 关系。

提示:

通过将文件从 Windows 文件资源管理器拖动到调查的文档选项卡上,可以将文档添加至实体。

添加 URL

知识图谱可以通过提供其 URL 来引用 Internet 上可用的网站或文档。

  1. 单击与该文档相关联的调查中的所有实体。
  2. 在调查的详细信息面板中,单击文档选项卡。
  3. 单击添加...添加 然后单击菜单上的从 URL 添加 添加

    随即显示从路径添加文档对话框。

  4. 提供该网站的 URL,然后单击添加

将在引用该 URL 的知识图谱中创建一个新的 Document 实体。 将在调查中选择的所有实体和该文档之间创建 HasDocument 关系。

预览文档

可以使用与在知识图谱中查看其他实体的详细信息相同的方式,在调查的详细信息面板中预览与实体相关联的文档。

  1. 在调查中选择具有关联文档的实体。
  2. 在调查的详细信息面板中,单击文档选项卡。
  3. 单击列表中的其中一个文档。
  4. 将鼠标悬停在名称列中的文档名称上。

    打开按钮 打开 随即出现。

  5. 单击要预览的文档的打开按钮 打开

    将遍历 HasDocument 关系并在详细信息面板中显示有关相关文档实体的信息。 面板顶部的位置栏将更新,以指示您到达此文档的方式。

    将自动填充文档实体的多个属性。 URL 属性用于存储文档的文件路径或 URL。 文件扩展名属性用于存储文件扩展名,例如 .txt;文件扩展名 .htm 用于描述网站。 还会填充其他属性,例如文件名和内容类型。

    仅针对文档实体,除了属性关系选项卡之外,详细信息面板还具有预览文本选项卡。

  6. 单击预览选项卡。

    如果可以预览文档类型,则其将显示在预览选项卡上。

  7. 单击预览选项卡上的打开按钮 打开 以查看 ArcGIS AllSource 外的文档。

    如果将本地计算机配置为在应用程序中打开此文件类型,则该应用程序将启动并打开文件。

指定可以预览的文件类型

默认配置某些文件类型,因此将不会在详细信息面板中预览这些文件类型。 可以通过修改选项对话框中的文件扩展名列表来更改可以预览的文件类型。 可以指定可以预览的文件类型列表,也可以指定无法预览的文件类型列表。

  1. 单击功能区中的工程选项卡,然后单击选项

    随即显示选项对话框。

  2. 单击选项对话框上的知识图谱选项卡。
  3. 单击受支持的预览文件扩展名标题。

    默认选择除这些类型之外的所有文件选项。 如果知识图谱中的文档为以下列表中的文件类型之一,则无法在详细信息面板中进行预览。

  4. 如果适用,请单击仅这些文件类型选项以将文件类型列表指定为可以预览的类型列表。
  5. 单击文件类型列表顶部的文本框,然后键入文件扩展名,例如 .docx。 按 Enter 键或单击随即出现的添加按钮 添加

    随即将该文件扩展名添加至列表。

  6. 单击文件类型列表中的文件扩展名,然后单击随即出现的移除按钮 移除
  7. 如果您希望保存当前文件扩展名列表以供将来参考或者在另一个工程中使用,请单击列表顶部的菜单按钮 菜单,然后单击保存按钮 保存。 在保存文件扩展名对话框中,浏览至可写入位置,为将创建的文本文件键入名称,然后单击确定

    可以在另一台计算机上将文件扩展名列表加载到 ArcGIS AllSource 中。

查看并更新文档的文本

将文档添加至实体时,将自动提取其包含的所有文本并将其存储在文档的文本属性中。 可以在调查详细信息面板的文本选项卡上查看已提取的文本。 默认情况下,文本选项卡上将仅显示文本属性内容的前 2,000 个字符。 如果需要,可以加载剩余的内容。

可以在 ArcGIS AllSource 中修改文档文本属性的内容。 由此可提供多种机会,包括:

  • 对于其中文本未存储在引用文件内的图片和其他文档,可以使用文本选项卡以添加有关该文档的注释。
  • 可以在独立于原始文档的知识图谱中存储文档文本的已修改版本。
  • 可以独立创建与文件或 URL 无关的文档实体,并使用其来捕获与调查相关的注释。

将为文档的文本属性创建索引。 由此,可以在搜索知识图谱时找到文档及其相关联的实体,包括已写入的任何注释。

例如,如果文档实体引用一个演示文稿,并且在 ArcGIS AllSource 外部对该演示文稿进行修改,则不会自动更新知识图谱中存储的文本。 可以更新已提取的文本以反映文件或网站的当前内容。 但是,您对文本所做的所有更改将丢失。

查看并更新已提取文本

可以在调查详细信息面板的文本选项卡上查看从文档中提取的文本。

  1. 在调查中选择具有关联文本文件或 Word 文档的实体。
  2. 在调查的详细信息面板中,单击文档选项卡。
  3. 将鼠标悬停在名称列中的文档名称上,然后单击随即出现的打开按钮 打开

    将遍历 HasDocument 关系并在详细信息面板中显示相关文档实体的信息。 面板顶部的位置栏将更新,以指示您到达此文档的方式。

  4. 在调查的详细信息面板中,单击文本选项卡。

    将显示文档文本属性的前 2,000 个字符。 如果更多文本可用,则将显示一条警告,指示仅显示文本的一部分并启用全部加载按钮。

  5. 单击文本选项卡顶部的全部加载 全部加载

    存储在文档文本属性中的所有内容都将显示在文本选项卡上。

  6. 如果提取的文本难以阅读,例如,因为其全部位于一行上,请选中文本选项卡顶部的文本自动换行
  7. 单击文本选项卡上的文本框并修改显示的文本,例如,在开头键入一个单词。
  8. 单击应用
  9. 单击文本选项卡顶部的提取文本 提取文本

    随即显示提取文本消息框,指示您对文档文本所做的任何更改(包括以上所做的编辑内容)都将丢失。

  10. 单击以从文档中提取文本并覆盖文档实体文本属性的内容。

向实体添加注释

要向实体添加注释,请完成以下步骤:

  1. 在调查的内容窗格中,单击实体类型 实体类型

    调查将列出知识图谱中的前 1,000 个实体。

  2. 单击列表中的实体。
  3. 单击详细信息面板上的关系选项卡。
  4. 单击添加按钮 添加

    随即创建关系。

  5. 对于新关系,请单击关系列,然后单击 HasDocument。
  6. 方向列中,接受默认选项:=>
  7. 单击实体类型列,然后单击“文档”。
  8. 单击实体列,然后单击新建实体

    Entity 列将显示文本(新建实体)以指示将创建新的 Document 实体。

  9. 单击应用

    将创建一个新的 Document 实体。 <Null> 值将显示在实体列中,因为实体的 name 属性为空。

  10. 将鼠标悬停在实体列中的 <Null> 值上,然后单击随即出现的打开按钮 打开

    将遍历 HasDocument 关系并在详细信息面板中显示 Document 实体的信息。 面板顶部的位置栏将更新,以指示您到达此文档的方式。

  11. 单击文本选项卡。
  12. 在文本框中键入注释,然后单击应用

指定从中提取文本的文件类型

默认配置某些文件类型,因此在将其添加为文档时,将不会从中提取文本。 可以通过修改选项对话框中的文件扩展名列表来更改可以提取文本的文件类型。 可以指定可从中提取文本的文件类型列表,也可以指定无法从中提取文本的文件类型列表。

  1. 单击功能区中的工程选项卡,然后单击选项

    随即显示选项对话框。

  2. 单击选项对话框上的知识图谱选项卡。
  3. 单击用于提取文本的受支持文件扩展名标题。

    默认选择除这些类型之外的所有文件选项。 如果知识图谱中的文档为以下列表中的文件类型之一,则在将文件添加为文档时将不会提取文本。

  4. 如果适用,请单击仅这些文件类型选项以将文件类型列表指定为可以提取文本的类型列表。
  5. 单击文件类型列表顶部的文本框,然后键入文件扩展名,例如 .png。 按 Enter 键或单击随即出现的添加按钮 添加

    随即将该文件扩展名添加至列表。

  6. 单击文件类型列表中的文件扩展名,然后单击随即出现的移除按钮 移除
  7. 如果您希望保存当前文件扩展名列表以供将来参考或者在另一个工程中使用,请单击列表顶部的菜单按钮 菜单,然后单击保存按钮 保存。 在保存文件扩展名对话框中,浏览至可写入位置,为将创建的文本文件键入名称,然后单击确定

    可以在另一台计算机上将文件扩展名列表加载到 ArcGIS AllSource 中。