子集化要素 (数据管理)

摘要

可将要素类或表的记录划分为两个子集:一个子集用作训练数据,另一个子集用作测试要素以比较和验证输出表面。

使用情况

  • 随机数生成器环境中,仅支持 Mersenne Twister 选项。 如果选择其他选项,则将使用 Mersenne Twister。

  • 将数据集划分为训练要素和测试要素在插值、机器学习以及其他分析工作流中比较常见,这些工作流涉及根据数据来估计和构建模型。

  • 如果使用多部分要素作为输入,则输出将为多部分要素的子集,而非单个要素。

参数

标注说明数据类型
输入要素

将根据其创建子集的要素或表。

Table View
输出训练要素类

将创建的训练要素的子集。

Feature Class; Table
输出测试要素类
(可选)

将创建的测试要素的子集。

Feature Class; Table
训练要素子集的大小
(可选)

输出训练要素类的大小,以输入要素的百分比或者要素的绝对数量形式输入。

Double
子集大小单位
(可选)

指定子集大小值将用作输入要素的百分比,还是要素的绝对数量。

  • 输入的百分比子集大小将用作训练数据集中输入要素的百分比。
  • 绝对值子集大小将用作训练数据集中要素的数量。
Boolean

arcpy.management.SubsetFeatures(in_features, out_training_feature_class, {out_test_feature_class}, {size_of_training_dataset}, {subset_size_units})
名称说明数据类型
in_features

将根据其创建子集的要素或表。

Table View
out_training_feature_class

将创建的训练要素的子集。

Feature Class; Table
out_test_feature_class
(可选)

将创建的测试要素的子集。

Feature Class; Table
size_of_training_dataset
(可选)

输出训练要素类的大小,以输入要素的百分比或者要素的绝对数量形式输入。

Double
subset_size_units
(可选)

指定子集大小值将用作输入要素的百分比,还是要素的绝对数量。

  • PERCENTAGE_OF_INPUT子集大小将用作训练数据集中输入要素的百分比。
  • ABSOLUTE_VALUE子集大小将用作训练数据集中要素的数量。
Boolean

相关主题