在输出中包含自定义属性

在 LocateXT 许可等级下可用。

从文档或文本中提取位置时,输出要素类将针对文档中找到每个位置包含一个点。属性表中的字段存储从文档中该位置前后提取的文本,以提供上下文并帮助您对其进行评估。如果您选择提取文档中找到的日期,则日期也会存储在要素属性中。也可以提取关注的其他信息,并将其存储在输出要素类的自定义字段中。

例如,包含火山喷发第一手资料的文件中包括与理解喷发性质相关的词语,例如噼啪声、气体、烟雾、灰烬、爆炸、蒸汽、熔岩等。您可以定义要识别和提取的词语,并将其放置在属性表中的自定义字段中。自定义属性将在自定义属性文件中定义 (.lxtca)。

了解位置的默认属性

如果您已拥有要使用的自定义属性文件,请将其添加到自定义属性文件列表,激活文件,并打开自定义属性切换。将位置提取到现有地图图层时,新的自定义属性字段不会添加到现有要素类的属性表中。将位置提取到新地图图层时,新的自定义属性会包含在输出要素类的属性表中。

  1. 打开提取位置窗格
  2. 打开自定义属性切换
  3. 访问自定义属性选项卡
  4. 添加想要用于自定义属性文件列表的自定义属性文件 (.lxtca),如果该文件尚不存在。
  5. 激活自定义属性文件
  6. 将位置提取到新的地图图层

自定义属性文件将用于在输出要素类的属性表中定义自定义字段。如果在扫描输入文件或文本时找到指定的内容,则会将其提取并存储在自定义字段中。

如果将位置提取到现有地图图层和要素类,则自定义字段不会添加到现有要素类的属性表中。但是,如果现有字段具有正确的数据类型,则可以使用现有字段来存储指定的内容。

打开或关闭自定义属性

打开自定义属性切换并将位置提取到新地图图层时,在活动的自定义属性文件中定义的自定义属性将包含在输出要素类的属性表中。关闭自定义属性切换并将位置提取到新地图图层时,输出要素类的属性表将仅包含默认属性。

  1. 提取位置窗格中,单击属性选项卡。
  2. 打开或关闭自定义属性切换。
    • 单击选项选项卡 选项,然后单击自定义属性切换。
    • 单击提取属性选项卡 提取属性,单击自定义属性选项卡,然后单击从自定义属性创建字段切换。

    单击处于关闭状态的切换以将其打开 切换已打开。单击处于打开状态的切换以将其关闭 切换已关闭

访问“自定义属性”选项卡

访问自定义属性选项卡以激活自定义属性文件,创建自定义属性文件或管理自定义属性文件。

  1. 提取位置窗格中,单击属性选项卡。
  2. 执行下列其中一项操作以访问自定义属性选项卡:
    • 单击选项选项卡 选项,然后单击自定义属性切换旁边的箭头 跳转到选项
    • 单击提取属性选项卡 提取属性,然后单击自定义属性选项卡。

定义自定义属性

自定义属性文件对话框第一次显示时,属性列表为空,但可在对话框中随时向文件添加新属性。首先在表单中键入用于定义新自定义属性的内容,并在键入完成后将其添加到属性列表。要编辑现有属性,请在属性列表中选择该属性并开始编辑;更改完成后,对该属性进行更新。如果您添加或编辑了属性而不想保存更改,请将其取消 - 这会清除表单并允许您开始定义新属性。

添加属性或更新现有属性后,属性名称将以斜体文本显示,并带有星号 (*),表明其尚未保存到自定义属性文件中。

自定义属性的四个组件如下:

  • 存储 - 这些属性用于确定在创建输出要素类时属性表中字段的定义方式。
  • 搜索选项 - 这些属性用于定义如何检查输入文档以获取可提取的信息。
  • 关键字 - 这些属性用于定义您要在输入文档中查找的内容。
  • 捕获选项 - 如果找到关键字,这些属性将定义从文档中提取并存储在字段中的文本。

存储

此类属性用于确定存储在输出要素类中的自定义属性在属性信息标题下的存储方式。在属性名称文本框中提供的名称也会显示在属性列表中,同时会用作字段的别名。

当您为属性名称键入一个值时,系统会将相应的值添加到字段名称文本框。将调整属性名称以满足典型字段命名要求。例如,如果在属性名称文本框中键入事件类型,则 Event_Type 会出现在字段名称文本框中。字段名称可以更改为任何适当的值。

当所有自定义属性都包含在要素类的属性表中时,将为其分配文本数据类型。默认情况下,会将字段大小设置为存储长度为 254 个字符的字符串。可根据需要将字段长度文本框中的值更改为更大或更小的值。

如果始终将地理数据库要素类创建为输出,请提供适合此类数据的字段名称和大小。如果您稍后使用相同的自定义属性文件并创建 shapefile 作为输出,则字段名称和大小将被截断以满足此类数据的允许限制。

搜索选项

此类属性用于定义如何检查输入文档,以及发现在指定搜索选项标题下指定了关键字后,应如何对其进行处理。搜索类型将确定如何检查文档和文本的关键字。类型下拉列表有以下两个选项:

  • 整个文档 - 将扫描整个文档以查找指定的关键字。这是默认设置。
  • 邻近位置 - 在文档中找到某个位置时,将扫描该位置之前和之后的文本以查找指定的关键字。在该位置之前扫描的文本数量由之前的字符文本框中的值确定。在该位置之后扫描的文本数量由之后的字符文本框中的值确定。之前的字符之后的字符文本框默认情况下都设置为 60 个字符,总范围为 120 个字符。

找到关键字后,其处理方式由匹配下拉列表中的值确定,该值有以下几个选项:

  • 仅保留第一个 - 仅处理在文档中或在指定范围内找到的第一个关键字。这是默认设置。
  • 全部保留 - 将处理在文档中或在指定范围内找到的所有关键字。

以一个描述加利福尼亚州雷德兰兹学校的输入文件为例,其中包括以下几行:

Date: February 7, 2019

Source: http://www.ed-data.org/district/San-Bernardino/Redlands-Unified

School: Redlands Senior High, Type: High School, Charter: N, Grades: 9-12, Location: 117.1717550°W 34.0552456°N, students: 2325, enrollDate: 2017/08/09, Established: 1891, address: 840 East Citrus Ave. Redlands CA 92374-5399

School: Citrus Valley High, Type: High School, Charter: N, Grades: 9-12, Location: 117.1922398°W 34.0816164°N, students: 2168, enrollDate: 2017/08/09, Established: 2008, address: 800 West Pioneer Ave. Redlands CA 92374-1509

该文档中有许多位置,以及许多有关词 Redlandsschool 的实例。如果定义两个关键字来提取这些词,则以下选项组合将产生如下结果:

  • 整个文档 + 仅保留第一个 - 每个位置都将具有相同的值。将提取文档中找到的第一个关键字并将其记录在自定义属性中。自定义属性值将是 Redlands
  • 整个文档 + 全部保留 - 每个位置都具有相同的值。在文档中找到的关键字 Redlandsschool 的所有实例都将被提取并记录在自定义属性中。提取的每段文本在属性值中由管道符 (|) 分隔。自定义属性值将是 Redlands | School | Redlands | School | Redlands | School | School | Redlands
  • 邻近位置 + 仅保留第一个,检查该位置之前 60 个字符和该位置之后零个字符的字符范围 - 每个位置具有在指定字符范围内找到第一个关键字。两个位置的自定义属性值均为 School
  • 邻近位置 + 仅保留第一个,检查该位置之前 100 个字符和该位置之后零个字符的字符范围 - 每个位置具有在指定字符范围内找到的关键字的所有实例。第一个位置将具有自定义属性值 School | Redlands | School。第二个位置将具有自定义属性值 School | School

关键字

自定义属性表单的关键字部分允许随时将新关键字添加到列表中。首先在表单中键入用于定义新关键字的内容,并在键入完成后将其添加到关键字列表。要编辑现有关键字,请在属性列表中选择该关键字并开始编辑;更改完成后,对该关键字进行更新。如果您添加或编辑了关键字而不想保存更改,请将其取消 - 这会清除表单并允许您开始定义新关键字。

添加新关键字或更新现有关键字后,关键字名称会在关键字列表中显示为斜体文本并带有一个星号 (*),表明其尚未保存到自定义属性文件中。

关键字文本框中键入要查找的文本。如果关键字中的最后一个字符是空白字符,则在评估关键字时将忽略该字符。

如果适用,请选中区分大小写。如果从文档中提取的文本应包含在关键字文本框中指定的文本,请选中包含在捕获中

捕获选项

用于确定将哪些文本从文档中提取出来并存储在输出要素类属性表内字段中的属性,将在捕获选项标题下进行定义。如果为自定义属性指定的字段大小小于已提取文本,则存储在该字段中的值将被截断。将从文档中按以下方式提取文本,从关键字的最后一个非空白字符开始,到通过所选捕获选项指定的停止点为止。提取的文本将包括空白字符。

下列六个选项用于定义将提取的文本。针对上述相同输入文档,提供了针对每个选项所提取的文本的示例。

  • 仅捕获关键字 - 仅提取在关键字文本框中指定的文本。若要提取指定关键字,不必针对该关键字选中包含在捕获中。例如,如果关键字是 redlands-unified,则将提取文本 redlands-unified 并将其存储在自定义字段中。这是默认设置。
  • 捕获的字符数 - 选择此选项后,将启用数量文本框。将提取指定数量的字符。默认情况下,将提取一个字符。例如,如果关键字是 established:,将提取五个字符,以存储包含年份的所有四个字符的值,例如 1891;存储在字段中的第一个字符是冒号 (:) 后面的空格。如果文档中行的冒号之后缺少空格,则该行的值可能会是 1957,
  • 捕获字数 - 选择此选项后,将启用数量文本框。提取文本时,将一直持续到最后一个指定词中的最后一个字符。默认情况下,将提取一个词。为此,词是两个非字母数字字符之间出现的文本。例如,如果关键字是 grades 并提取两个词,则会提取文本 : 9-12。第一个词是 9,第二个词是 12
  • 捕获行数 - 选择此选项后,将启用数量文本框。将提取指定数量的行。默认情况下,将提取一行。为此,一行是从关键字最后一个字符到当前行末尾的位置。如果提取多行,则还会提取符合指定行数的所有字符。
  • 一直捕获到空白行 - 将提取下一个空白行或文档末尾之前的文本。例如,如果关键字为 dates 且文档中没有空行,则会提取文档末尾之前的所有文本。如果文件中的源 URL 后面有一个空行,则会提取空白行之前的所有文本。
  • 一直搜索到停止字符串 - 选择此选项后,将启用停止字符串文本文本框。将提取指定停止字符串之前的所有文本。例如,如果关键字是 type: 且停止字符串是逗号 (,),将提取这之间的文本,例如 High School。使用此选项时,区分大小写包含在捕获中复选框也会针对停止字符串变为启用状态,可根据需要选中上述复选框。使用关键字(如 address:)和一个停止字符串(如 92374)时,将提取停止字符串之前且包括停止字符串在内的文本: 840 East Citrus Ave. Redlands CA 92374。如果其他地址具有不同的邮政编码,则将提取指定邮政编码再次出现或文件结尾之前的所有文本。

添加属性

自定义属性文件对话框首次出现时,将允许随时向自定义属性文件中添加新属性。首先在表单中键入用于定义新自定义属性的内容,并在键入完成后将其添加到属性列表。添加属性后,属性名称将以斜体文本显示,并带有星号 (*),表明其尚未保存到自定义属性文件中。

如果先前打开了对话框并且已开始编辑现有属性,则该属性的名称将显示在属性名称文本框中。单击表单底部的取消可停止属性编辑。且会清除表单,并允许您开始定义新的属性。

  1. 创建自定义属性文件编辑自定义属性文件

    自定义属性显示对话框随即出现。属性名称文本框将显示新属性提示,表明表单已准备就绪,可以定义新属性。

  2. 设置用于确定输出要素类中字段存储方式的存储选项。
    1. 属性名称文本框中输入属性名称。
    2. 字段名称文本框中,如果适用,请在文本框中调整将存储在要素类中的字段的名称。
    3. 可根据需要将字段长度文本框中的值更改为更长或更短。
  3. 设置搜索选项,以确定输入文档对要查找的信息的检查方式。
    1. 单击类型下拉列表并设置查找关键字的文本范围。如果适用,请使用之前的字符之后的字符文本框设置文本范围。
    2. 单击匹配下拉列表并选择一个选项,指示在输入文件中查找第一个关键字还是所有匹配项。
  4. 将关键字添加到自定义属性。
    1. 关键字文本框,键入要在文档中查找的文本。
    2. 如果识别关键字的文本区分大小写,则选中区分大小写
    3. 如果关键字应包含在提取的文本中,请检查包含在捕获中
  5. 指定用于定义从文档中提取并存储在字段中的内容的捕获选项。
    1. 单击捕获类型下拉列表并单击用于确定如何定义要提取的文本的相应选项。
    2. 如果针对选定捕获类型启用了其中一个选项,请在数量文本框或停止字符串文本文本框中键入一个值。
    3. 如果停止字符串文本文本框已启用,请选中区分大小写包含在捕获中(如果适用)。
  6. 单击添加关键字

    关键字即被添加到关键字列表中。

  7. 单击添加属性,将此自定义属性定义添加到属性列表中。
  8. 单击保存,将自定义属性保存到自定义属性文件中。

编辑属性

要在自定义属性文件对话框中编辑现有属性,请在属性列表中选择它并开始编辑。更改完成后,请对属性进行更新。如果您编辑了属性而不想保存更改,请将其取消 - 这会清除表单并允许您开始或编辑另一个属性。

更新现有属性后,属性名称将以斜体文本显示,并带有星号 (*),表明其尚未保存到自定义属性文件中。

  1. 创建自定义属性文件编辑自定义属性文件

    自定义属性显示对话框随即出现。属性列表包括先前存储在文件中的所有自定义属性。对话框可随时添加新属性 - 属性名称文本框为空。

  2. 将鼠标悬停在属性列表中待编辑的属性上方,然后单击编辑按钮 编辑

    属性的属性将显示在表单的右侧。

  3. 如果适用,可通过调整属性信息标题下的值来更改字段在输出要素类中的存储方式。
  4. 如果适用,可通过调整搜索选项标题下的值来更改查找信息时针对输入文档采取的扫描方式。
  5. 将鼠标悬停在关键字列表中待编辑的关键字上方,然后单击编辑按钮 编辑

    关键字的属性即会显示在表单中。

  6. 如果适用,可通过调整关键字标题下的值来更改要在文档中查找的文本。
  7. 如果适用,可通过调整捕获选项标题下的值来更改找到关键字后从文档中提取文本的方式。
  8. 单击更新关键字以保留对此关键字的更改,或单击取消以停止编辑关键字。

    更新后,用于识别关键字列表中的关键字的文本将进行修改,以反映您的更改(如果适用)。关键字以斜体显示并带有星号 (*) 时,表示更改尚未保存。

  9. 删除对于提取所需信息而言无效的关键字。将鼠标悬停在关键字列表中要删除的关键字上,然后单击移除按钮 移除
  10. 单击更新属性以保留对此属性的更改,或单击取消以停止编辑属性。

    更新后,用于识别属性列表中的属性的文本将进行修改,以反映您的更改(如果适用)。属性的名称以斜体显示并带有星号 (*) 时,表示更改尚未保存。对话框顶部的文件名以斜体显示并带有星号 (*) 时,表示更改尚未保存。

  11. 单击保存,将更新自定义属性文件中的自定义属性定义。
  12. 单击关闭以停止编辑自定义属性文件。
提示:

可以双击属性列表中的属性以对其进行编辑。同样,您可以双击关键字列表中的关键字对其进行编辑。

移除属性

要从自定义属性文件中移除属性,请先编辑该文件。将鼠标悬停在属性列表中要移除的属性上,然后单击移除按钮 移除 或按 Delete 键。也可以按照下列步骤从自定义位置文件中一次移除多个位置。

  1. 创建自定义属性文件编辑自定义属性文件

    自定义属性显示对话框随即出现。

  2. 单击要移除的第一个属性。

    该属性将被选定。

  3. CtrlShift 键。
  4. 重复步骤 2 以选择要移除的其他属性。
  5. 单击属性列表顶部的移除按钮 移除,或按 Delete 键。

    所有选定属性都会被删除。

  6. 单击保存,将更新自定义属性文件中的自定义属性定义。
  7. 单击关闭以停止编辑自定义属性文件。