Incluir atributos personalizados en la salida

Disponible con licencia de LocateXT.

Al extraer ubicaciones de documentos o texto, la clase de entidad de salida contiene un punto por cada ubicación encontrada en el documento. Los campos de la tabla de atributos almacenan el texto extraído del documento antes y después de la ubicación para proporcionar contexto y ayudar a evaluarlo. Si elige extraer las fechas que se encuentran en el documento, las fechas también se almacenan en atributos de entidades. También puede extraer información adicional de interés y almacenarla en campos personalizados en la clase de entidad de salida.

Por ejemplo, los documentos que contienen relatos de primera mano de una erupción volcánica pueden contener palabras relevantes a la hora de comprender la naturaleza de la erupción, como crepitar, gas, neblina, ceniza, explosión, vapor, lava, etc. Las palabras a reconocer y extraer se pueden definir y colocar en un campo personalizado en la tabla de atributos. Los atributos personalizados se definen en un archivo de atributos personalizados (.lxtca).

Más información sobre los atributos predeterminados de la ubicación

Si desea usar un archivo de atributos personalizados, agréguelo a la lista Archivos de atributos personalizados, active el archivo y active el botón de alternancia de atributos personalizados. Al extraer ubicaciones a una capa de mapa existente, los nuevos campos de atributos personalizados no se agregan a la tabla de atributos de la clase de entidad existente. Al extraer ubicaciones a una capa de mapa mueva, los nuevos atributos personalizados se incluyen en la tabla de atributos de la clase de entidad de salida.

El archivo de atributos personalizados se utiliza para definir campos personalizados en la tabla de atributos de la clase de entidad de salida. Si el contenido especificado se encuentra al escanear los archivos de entrada o el texto, este se extrae y se almacena en los campos personalizados.

Si extrae ubicaciones en una capa de mapa y clase de entidad existentes, los campos personalizados no se agregan a la tabla de atributos de la clase de entidad existente. Sin embargo, los campos existentes se pueden usar para almacenar el contenido especificado si tienen el tipo de datos correcto.

Activar o desactivar los atributos personalizados

Cuando el botón de alternancia de los atributos personalizados está activado y se extraen ubicaciones a una nueva capa de mapa, los atributos personalizados definidos en el archivo de atributos personalizados activo se incluyen en la tabla de atributos de la clase de entidad de salida. Cuando el botón de alternancia de los atributos personalizados está desactivado y se extraen ubicaciones a una nueva capa de mapa, la tabla de atributos de la clase de entidad de salida solo incluye los atributos predeterminados.

  1. En el panel Extraer ubicaciones, haga clic en la pestaña Propiedades.
  2. Active o desactive el botón de alternancia de los atributos personalizados.
    • Haga clic en la pestaña Opciones Opciones y haga clic en el botón de alternancia Atributos personalizados.
    • Haga clic en la pestaña Extraer atributos Extraer atributos, haga clic en la pestaña Atributos personalizados y haga clic en el botón de alternancia Crear campos a partir de atributos personalizados.

    Haga clic en el botón de alternancia que esté desactivado para activarlo Botón de alternancia activado. Haga clic en el botón de alternancia que esté activado para desactivarlo Botón de alternancia desactivado.

Acceder a la pestaña Atributos personalizados

Acceda a la pestaña Atributos personalizados para activar o crear un archivo de atributos personalizados o para administrar los archivos de atributos personalizados.

  1. En el panel Extraer ubicaciones, haga clic en la pestaña Propiedades.
  2. Realice una de las acciones siguientes para acceder a la pestaña Atributos personalizados:
    • Haga clic en la pestaña Opciones Opciones y haga clic en la flecha Opción Saltar a junto al botón de alternancia Atributos personalizados.
    • Haga clic en la pestaña Extraer atributos Extraer atributos y haga clic en la pestaña Atributos personalizados.

Definir un atributo personalizado

Cuando aparece por primera vez el cuadro de diálogo Archivo de atributos personalizados, la lista Atributos está vacía, pero el cuadro de diálogo está listo para agregar inmediatamente nuevos atributos al archivo. Comience a escribir en el formulario para definir su nuevo atributo personalizado y agréguelo a la lista Atributos cuando termine. Para editar un atributo existente, selecciónelo en la lista de atributos, comience a editarlo y actualice el atributo cuando complete los cambios. Si comienza a agregar o editar un atributo y no desea guardar los cambios, cancele la operación (al hacerlo, el formulario se borra y puede comenzar a definir un nuevo atributo).

Cuando se agrega un atributo o se actualiza uno existente, su nombre aparece en cursiva con un asterisco (*) para indicar que no se ha guardado en el archivo de atributos personalizados.

Los cuatro componentes de un atributo personalizado son los siguientes:

  • Almacenamiento: estas propiedades determinan cómo se define el campo en la tabla de atributos cuando se crea una clase de entidad de salida.
  • Opciones de búsqueda: estas propiedades definen cómo se examinan los documentos de entrada en busca de la información que se puede extraer.
  • Palabras clave: estas propiedades definen lo que se busca en los documentos de entrada.
  • Opciones de captura: estas propiedades definen el texto a extraer del documento y almacenar en el campo cuando se encuentra una palabra clave.

Almacenamiento

Las propiedades que determinan cómo se almacena un atributo personalizado en la clase de entidad de salida se definen en el encabezado Información del atributo. El nombre proporcionado en el cuadro de texto Nombre del atributo aparece en la lista Atributos y se usa también como alias del campo.

Conforme escribe un valor para el nombre del atributo, se agrega un valor correspondiente al cuadro de texto Nombre del campo. El nombre del atributo se ajusta para cumplir con los requisitos característicos de los nombres de campos. Por ejemplo, si escribe Tipo de evento en el cuadro de texto Nombre del atributo, aparece Event_Type en el cuadro de texto Nombre del campo. El nombre del campo se puede cambiar a cualquier valor adecuado.

A todos los atributos personalizados se les asigna el tipo de datos de texto cuando se incluyen en la tabla de atributos de la clase de entidad. De forma predeterminada, el tamaño del campo está configurado para almacenar cadenas de 254 caracteres de longitud. Cambie el valor en el cuadro de texto Longitud del campo a un valor mayor o menor, según corresponda.

Si siempre crea clases de entidad de geodatabase como salida, proporcione nombres de campo y tamaños apropiados para este tipo de datos. Si usa el mismo archivo de atributos personalizados posteriormente y crea un shapefile como salida, los nombres y tamaños de los campos se truncarán al límite permitido para este tipo de datos.

Opciones de búsqueda

Las propiedades que definen cómo se examinan los documentos de entrada y cómo se administran las palabras clave cuando se encuentran se especifican bajo el encabezado Opciones de búsqueda. El tipo de búsqueda determina cómo se examinan los documentos y el texto en busca de palabras clave. La lista desplegable Tipo tiene las siguientes dos opciones:

  • Todo el documento: se escanea todo el documento en busca de las palabras clave especificadas. Esta es la configuración predeterminada.
  • Ubicaciones cercanas: cuando se encuentra una ubicación en un documento, el texto anterior y posterior a la ubicación se escanea en busca de las palabras clave especificadas. La cantidad a escanear de texto anterior a la ubicación la determina el valor del cuadro de texto Caracteres anteriores. La cantidad a escanear de texto posterior a la ubicación la determina el valor del cuadro de texto Caracteres posteriores. Los cuadros de texto Caracteres anteriores y Caracteres posteriores están configurados de forma predeterminada en 60 caracteres, para un rango total de 120 caracteres.

Cuando se encuentra una palabra clave, el valor de la lista desplegable Coincidencias determina cómo se administra, y dispone de las siguientes opciones:

  • Conservar solo el primero: solo se administra la primera palabra clave encontrada en el documento o en el rango especificado. Esta es la opción predeterminada.
  • Conservar todo: se administran todas las palabras clave encontradas en el documento o en el rango especificado.

Considere un documento de entrada que describa las escuelas de Redlands, California, y que incluye las siguientes líneas:

Fecha: 7 de febrero de 2019

Fuente: http://www.ed-data.org/district/San-Bernardino/Redlands-Unified

Escuela: Redlands Senior High, Tipo: Escuela secundaria, Nivel: N, Cursos: 9-12, Ubicación: 117.1717550°W 34.0552456°N, Estudiantes: 2325, Fecha de inscripción: 2017/08/09, Fundación: 1891, Dirección: 840 East Citrus Ave. Redlands CA 92374-5399

Escuela: Citrus Valley High, Tipo: Escuela secundaria, Nivel: N, Cursos: 9-12, Ubicación: 117.1922398°W 34.0816164°N, Estudiantes: 2168, Fecha de inscripción: 2017/08/09, Fundación: 2008, Dirección: 800 West Pioneer Ave. Redlands CA 92374-1509

Este documento tiene muchas ubicaciones y muchas instancias de las palabras Redlands y escuela. Si se definen dos palabras clave para extraer estas palabras, la siguiente combinación de opciones producirá los siguientes resultados:

  • Todo el documento + Conservar solo el primero: cada ubicación tendrá el mismo valor. La primera palabra clave encontrada en el documento se extrae y se registra en el atributo personalizado. El valor del atributo personalizado será Redlands.
  • Todo el documento + Conservar todo: cada ubicación tendrá el mismo valor. Todas las instancias de las palabras clave Redlands y escuela encontradas en el documento se extraen y se registran en el atributo personalizado. Cada fragmento de texto extraído está separado por caracteres de barra vertical (|) en el valor del atributo. El valor del atributo personalizado será Redlands | Escuela | Redlands | Escuela | Redlands | Escuela | Escuela | Redlands
  • Ubicaciones cercanas + Conservar solo el primero, y comprobar un rango de 60 caracteres antes de la ubicación y de cero caracteres después: cada ubicación recibe la primera palabra clave encontrada en el rango de caracteres especificado. Ambas ubicaciones tendrán el valor de atributo personalizado de Escuela.
  • Ubicaciones cercanas + Conservar solo el primero, y comprobar un rango de 100 caracteres antes de la ubicación y de cero caracteres después: cada ubicación recibe todas las instancias de las palabras clave encontradas en el rango de caracteres especificado. La primera ubicación tendrá el valor de atributo personalizado de Escuela | Redlands | Escuela. La segunda ubicación tendrá el valor de atributo personalizado de Escuela | Escuela.

Palabras clave

La parte de palabras clave del formulario del atributo personalizado está preparada para agregar inmediatamente nuevas palabras clave a la lista. Comience a escribir en el formulario para definir una nueva palabra clave y agréguela a la lista Palabras clave cuando termine. Para editar una palabra clave existente, selecciónela en la lista de palabras clave, comience a editarla y actualice la palabra clave cuando complete los cambios. Si comienza a agregar o editar una palabra clave y no desea guardar los cambios, cancele (esto borra el formulario y permite comenzar a definir una nueva palabra clave).

Cuando se agrega una nueva palabra clave o se actualiza una existente, su nombre aparece en la lista Palabras clave en cursiva con un asterisco (*) para indicar que no se ha guardado en el archivo de atributos personalizados.

Escriba el texto que está buscando en el cuadro de texto Palabra clave. Si el último carácter de la palabra clave es un espacio en blanco, se ignora al evaluar la palabra clave.

Si procede, active Distinción entre mayúsculas y minúsculas. Si el texto extraído del documento debe incluir el texto especificado en el cuadro de texto Palabra clave, active Incluir en captura.

Opciones de captura

Las propiedades que determinan el texto a extraer del documento y almacenar en el campo de la tabla de atributos de la clase de entidad de salida se definen bajo el encabezado Opciones de captura. Si el tamaño de campo especificado para el atributo personalizado es más pequeño que el texto extraído, el valor almacenado en el campo se truncará. El texto se extrae tal como está en el documento, comenzando desde el último carácter de espacio no blanco de la palabra clave hasta el punto de parada especificado por la opción de captura seleccionada. El texto extraído incluye los caracteres de espacios en blanco.

Las siguientes seis opciones definen el texto a extraer. Considerando el mismo documento de entrada descrito anteriormente, se proporcionan ejemplos del texto extraído para cada opción.

  • Capturar solo palabra clave: solo se extrae el texto especificado en el cuadro de texto Palabra clave. No es necesario activar Incluir en captura en la palabra clave para extraer la palabra clave especificada. Por ejemplo, si la palabra clave es redlands-unified, el texto redlands-unified se extrae y almacena en el campo personalizado. Esta es la opción predeterminada.
  • Capturar número de caracteres: cuando esta opción está seleccionada, el cuadro de texto Número está habilitado. Se extrae el número de caracteres especificado. De forma predeterminada, se extrae un carácter. Por ejemplo, si la palabra clave es Fundación:, se extraen cinco caracteres para almacenar un valor que incluya los cuatro caracteres del año, como 1891. El primer carácter almacenado en el campo será el espacio que sigue a los dos puntos (:). Si a una línea del documento le falta un espacio después de los dos puntos, esa línea puede tener el valor 1957, en su lugar.
  • Capturar número de palabras: cuando esta opción está seleccionada, el cuadro de texto Número está habilitado. Se extrae el texto hasta el último carácter de la última palabra especificada. De forma predeterminada, se extrae una palabra. Para estos fines, una palabra es el texto que aparece entre dos caracteres no alfanuméricos. Por ejemplo, si la palabra clave es Cursos y extrae dos palabras, se extrae el texto : 9-12. La primera palabra es 9 y la segunda es 12.
  • Capturar número de líneas: cuando esta opción está seleccionada, el cuadro de texto Número está habilitado. Se extrae el número de líneas especificado. De forma predeterminada, se extrae una línea. Para estos fines, una línea es la posición que sigue al último carácter de la palabra clave hasta el final de la línea actual. Si se extrae más de una línea, también se extraen todos los caracteres del siguiente número de líneas especificadas.
  • Capturar hasta línea en blanco: se extrae el texto hasta la siguiente línea en blanco o el final del documento. Por ejemplo, si la palabra clave es Fechas y no hay una línea en blanco en el documento, se extrae todo el texto hasta el final del documento. Si hay una línea en blanco después de la dirección URL de origen en el archivo, se extrae todo el texto hasta la línea en blanco.
  • Buscar hasta cadena de parada: cuando esta opción está seleccionada, el cuadro de texto Cadena de caracteres de parada está habilitado. Se extrae todo el texto hasta la cadena de parada especificada. Por ejemplo, si la palabra clave es Tipo: y la cadena de parada es una coma (,), se extrae el texto intermedio, como Escuela secundaria. Con esta opción, las casillas de verificación Distinción entre mayúsculas y minúsculas e Incluir en captura también se habilitan para la cadena de parada, que debe estar activada, según corresponda. Con una palabra clave como Dirección: y una cadena de parada como 92374, se extrae el texto incluida la cadena de parada: 840 East Citrus Ave. Redlands CA 92374. Si otras direcciones tienen un código postal diferente, se extrae todo el texto hasta la próxima aparición del código postal especificado o el final del archivo.

Agregar un atributo

Cuando aparezca por primera vez el cuadro de diálogo Archivo de atributos personalizados, puede agregar inmediatamente nuevos atributos al archivo de atributos personalizados. Comience a escribir en el formulario para definir su nuevo atributo personalizado y agréguelo a la lista Atributos cuando termine. Al agregar un atributo, su nombre aparece en cursiva con un asterisco (*) para indicar que no se ha guardado en el archivo de atributos personalizados.

Si el cuadro de diálogo se abrió anteriormente y comenzó a editar un atributo existente, el nombre de ese atributo aparece en el cuadro de texto Nombre del atributo. Haga clic en Cancelar en la parte inferior del formulario para detener la edición del atributo. El formulario se borra y le permite comenzar a definir un nuevo atributo en su lugar.

  1. Cree un archivo de atributos personalizados o edite un archivo de atributos personalizados.

    Aparece el cuadro de diálogo Archivo de atributos personalizados. El cuadro de texto Nombre del atributo muestra la sugerencia Nuevo atributo, que indica que el formulario está listo para definir un nuevo atributo.

  2. Configure las opciones de almacenamiento que determinan cómo se almacena el campo en la clase de entidad de salida.
    1. Introduzca un nombre para el atributo en el cuadro de texto Nombre del atributo.
    2. En el cuadro de texto Nombre del campo, ajuste el nombre del campo a almacenar en la clase de entidad, si corresponde.
    3. Cambie el valor en el cuadro de texto Longitud del campo a una longitud más larga o más corta según corresponda.
  3. Configure las opciones de búsqueda que determinen cómo se examina el documento de entrada en busca de la información a encontrar.
    1. Haga clic en la lista desplegable Tipo y configure el alcance del texto en que buscar la palabra clave. Configure el rango de texto usando los cuadros de texto Caracteres anteriores y Caracteres posteriores, si corresponde.
    2. Haga clic en la lista desplegable Coincidencias y elija una opción que indique si desea encontrar la primera aparición de una palabra clave en el archivo de entrada o todas las apariciones.
  4. Agregue palabras clave al atributo personalizado.
    1. Escriba en el cuadro de texto Palabra clave el texto a buscar en el documento.
    2. Si el texto que identifica la palabra clave distingue entre mayúsculas y minúsculas, active Distinción entre mayúsculas y minúsculas.
    3. Si la palabra clave debe ser incluida en el texto extraído, active Incluir en captura.
  5. Especifique las opciones de captura que definen qué contenido se extrae del documento y se almacena en el campo.
    1. Haga clic en la lista desplegable Tipo de captura y haga clic en la opción adecuada para determinar cómo definir el texto a extraer.
    2. Escriba un valor en el cuadro de texto Número o en el cuadro de texto Detener texto de cadena de caracteres, si una de estas opciones se habilita para el tipo de captura seleccionado.
    3. Si el cuadro de texto Texto de cadena de parada está habilitado, active Distinción entre mayúsculas y minúsculas e Incluir en captura, si corresponde.
  6. Haga clic en Agregar palabra clave.

    La palabra clave se agrega a la lista Palabras clave.

  7. Haga clic en Agregar atributo para agregar esta definición de atributo personalizado a la lista Atributos.
  8. Haga clic en Guardar para guardar el atributo personalizado en el archivo de atributos personalizados.

Editar un atributo

Para editar un atributo existente en el cuadro de diálogo Archivo de atributos personalizados, selecciónelo en la lista de atributos y comience a editar. Actualice el atributo cuando finalice los cambios. Si comienza a editar un atributo y no desea guardar los cambios, cancele la operación (al hacerlo, el formulario se borra y puede comenzar de nuevo o editar otro atributo en su lugar).

Al actualizar un atributo existente, su nombre aparece en cursiva con un asterisco (*) para indicar que no se ha guardado en el archivo de atributos personalizados.

  1. Cree un archivo de atributos personalizados o edite un archivo de atributos personalizados.

    Aparece el cuadro de diálogo Archivo de atributos personalizados. La lista Atributos incluye todos los atributos personalizados almacenados anteriormente en el archivo. El cuadro de diálogo está listo para agregar inmediatamente un nuevo atributo: el cuadro de texto Nombre del atributo está vacío.

  2. Pase el ratón por el atributo que desea editar en la lista Atributos y haga clic en el botón Editar Editar.

    Las propiedades del atributo aparecen en el formulario a la derecha.

  3. Cambie la forma en que el campo se almacena en la clase de entidad de salida ajustando los valores bajo el encabezado Información del atributo, si corresponde.
  4. Cambie la forma en que se escanea el documento de entrada para buscar información ajustando los valores bajo el encabezado Opciones de búsqueda, si corresponde.
  5. Pase el ratón por encima de la palabra clave que desea editar en la lista Palabras clave y haga clic en el botón Editar Editar.

    Las propiedades de la palabra clave aparecen en el formulario.

  6. Cambie el texto a buscar en el documento ajustando los valores bajo el encabezado Palabra clave, si corresponde.
  7. Cambie la forma en que se extrae el texto del documento cuando se encuentra una palabra clave ajustando los valores bajo el encabezado Opciones de captura, si corresponde.
  8. Haga clic en Actualizar palabra clave para conservar los cambios a esta palabra clave, o haga clic en Cancelar para dejar de editar la palabra clave.

    Cuando se actualiza, el texto que identifica la palabra clave en la lista Palabras clave se modifica para reflejar los cambios, si corresponde. La palabra clave aparece en cursiva con un asterisco (*) para indicar que los cambios no se han guardado.

  9. Elimine toda palabra clave que no sea efectiva para extraer la información deseada. Pase el ratón por encima de la palabra clave que desea eliminar de la lista Palabras clave y haga clic en el botón Eliminar Eliminar.
  10. Haga clic en Actualizar atributo para conservar los cambios a este atributo, o haga clic en Cancel para dejar de editar el atributo.

    Cuando se actualiza, el texto que identifica el atributo en la lista Atributos se modifica para reflejar los cambios, si corresponde. El nombre del atributo aparece en cursiva con un asterisco (*) para indicar que los cambios no se han guardado. El nombre de archivo aparece en la parte superior del cuadro de diálogo en cursiva con un asterisco (*) para indicar que los cambios no se han guardado.

  11. Haga clic en Guardar para actualizar las definiciones de atributos personalizados en el archivo de atributos personalizados.
  12. Haga clic en Cerrar para dejar de editar el archivo de atributos personalizados.
Sugerencia:

Se puede hacer doble clic en un atributo de la lista Atributos para editarlo. Del mismo modo, se puede hacer doble clic en una palabra clave de la lista Palabras clave para editarla.

Eliminar atributos

Para eliminar un atributo de un archivo de atributos personalizados, primero edite el archivo. Pase el ratón por el atributo que desea eliminar de la lista Atributos y haga clic en el botón Eliminar Eliminar, o pulse Supr. También puede eliminar a la vez varias ubicaciones de un archivo de ubicaciones personalizadas siguiendo los pasos siguientes.

  1. Cree un archivo de atributos personalizados o edite un archivo de atributos personalizados.

    Aparece el cuadro de diálogo Archivo de atributos personalizados.

  2. Haga clic en el primer atributo que desee eliminar.

    El atributo se selecciona.

  3. Pulse Ctrl o Mayús.
  4. Repita el paso 2 para seleccionar los otros atributos que desee eliminar.
  5. Haga clic en el botón Eliminar Eliminar en la parte superior de la lista Atributos, o pulse Supr.

    Se eliminan todos los atributos seleccionados.

  6. Haga clic en Guardar para actualizar las definiciones de atributos personalizados en el archivo de atributos personalizados.
  7. Haga clic en Cerrar para dejar de editar el archivo de atributos personalizados.