Skip To Content

使用模型

您可以在 ArcGIS Pro 中的 GeoAI 工具箱提供的使用深度学习转换文本工具中使用 HF 文本翻译模型。

使用文本翻译模型

完成以下步骤以使用文本翻译的模型:

  1. ArcGIS Living Atlas of the World 下载 HF 文本翻译预训练模型。
  2. 浏览至分析选项卡上的工具
    “分析”选项卡上的“工具”
  3. 单击地理处理窗格中的工具箱选项卡,选择 GeoAI 工具,然后浏览至文本分析下的使用深度学习转换文本工具。
    “使用深度学习转换文本”工具
  4. 按照以下说明设置参数选项卡上的变量:
    1. 输入表设置为包含待翻译文本的输入点、线或面要素类或表。
    2. 文本字段设置为输入要素类或表中包含待翻译文本的文本字段。
    3. 对于输入模型定义文件,选择模型 .dlpk 文件。
    4. 结果字段设置为输出要素类或表中包含已翻译文本的字段的名称。

      默认字段名称为 Result

    5. 对于参数,根据需要更改参数值。
      • huggingface_id - 托管在 huggingface.co 上的预训练文本翻译模型的模型 ID。

        如下图所示,您可以在 Hugging Face 模型中心的自然语言处理类别下的任务部分选择翻译标签来过滤文本翻译模型:

        模型中心的文本摘要

        模型 ID 的格式为 {用户名}/{资料档案库},如模型页面顶部所示:

        模型 ID

        仅支持包含 config.json 文件的模型。 您可以在模型页面的文件和版本选项卡下验证此文件,如下图所示:

        config.json 和 preprocessor_config.json 位于“文件和版本”选项卡
      • source_lang - 输入文本的语言代码。
      • target_lang - 翻译文本的语言代码。
      • min_length - 翻译输出的最小字符数。 默认值为 10。
      • max_length - 翻译输出允许的最大字符数。 默认值为 512。
      • num_beams - 波束搜索期间使用的波束数量(默认为 4)。 较高的数值可能会提高质量,但会增加推断时间。
    6. 批量大小设置为一次处理的行数。

      增加批量大小可以提高工具性能;但是随着批量大小增加,所用内存也将随之增加。

      “使用深度学习转换文本”工具的“参数”选项卡
  5. 按照以下说明设置环境选项卡上的变量:
    1. 对于处理器类型,选择 CPUGPU

      如果可以,建议您选择 GPU 并设置 GPU ID 以指定要使用的 GPU。

      “使用深度学习转换文本”工具的“环境”选项卡
  6. 单击运行

    输出列将添加到输入表中。

    模型的翻译结果

在本主题中
  1. 使用文本翻译模型