Skip To Content

使用 Google BigQuery 记录

可以使用 Google BigQuery 表中的记录作为 ArcGIS Data Pipelines 的输入。

用法说明

使用 Google BigQuery 时,请谨记以下信息:

  • 要使用 Google BigQuery 中的数据集,您必须首先创建一个数据存储项目。 数据存储项目安全地存储凭据和连接信息,以便 Data Pipelines 能够读取数据。 要创建数据存储,请按照以下“连接到 Google BigQuery”部分中的步骤进行操作。
  • 要更改之前配置的数据存储项目,使用数据存储项目参数移除当前选定项目,然后选择以下选项之一:
    • 添加数据存储 - 创建新数据存储项目。
    • 选择项目 - 浏览内容以选择现有数据存储项目。
  • 可以使用数据集参数指定数据集,并使用表格参数指定包含要使用的数据的表格。
  • 为了提高读取输入数据集的性能,请考虑以下选项:
    • 使用使用缓存参数存储数据集的副本。 仅在至少已连接一个打开并显示编辑器的浏览器选项卡时,缓存副本才会保留。 这样可以提高在处理过程中访问数据的速度。 如果源数据自缓存后已更新,请取消选中此参数并再次预览或运行该工具。
    • 在配置输入数据集之后,可以配置以下工具之一,以限制数据处理量:

连接到 Google BigQuery

要使用存储在 Google BigQuery 中的数据,请完成以下步骤以在 Data Pipelines 编辑器中创建数据存储项目。

  1. Data Pipelines 编辑器工具栏中,单击输入,然后选择 Google BigQuery

    随即显示选择数据存储连接对话框。

  2. 选择添加新数据存储
  3. 单击下一步

    随即出现添加与数据存储的连接对话框。

  4. 提供密钥文件,其中包含用于访问服务账户的凭据。
  5. 提供包含要连接的数据的工程 ID。
  6. 单击下一步

    随即显示项目详细信息窗格。

  7. 为新的数据存储项目提供标题。

    该标题将显示在您的门户内容中。 您还可以将项目存储在特定文件夹中,并提供项目标签或摘要。

  8. 单击创建连接以创建数据存储项目。

    随即将 Google BigQuery 元素添加至画布,您可以为特定数据集配置该元素。

局限性

以下为已知局限性:

  • 不支持将 Google BigQuery 数据集的视图作为 Data Pipelines 的输入。
  • 连接到 Google BigQuery 不支持刷新令牌。
  • 要使用数据存储项连接到外部数据源,您必须为数据存储项的所有者。 不支持将与您共享的数据存储项目作为输入。

许可要求

需要以下许可和配置:

  • Creator 或 GIS Professional 用户类型
  • 发布者、服务商或管理员角色,或等效的自定义角色

有关 Data Pipelines 要求的详细信息,请参阅要求