样本数据和自变量

样本数据

所有的回归分析方法都需要样本数据(样本数据可以是地面调查得到的或者由地基/背包激光雷达扫描得到),以训练回归分析模型。在回归分析对话框的导入训练数据中,输入样本数据。 样本数据应为文本格式(txt扩展名),且必须包含描述数据信息的文件头。前两列应为样本的X和Y坐标,后面是任意因变量(可能会给出多个因变量,但是每次回归分析只使用一个因变量)。如果每个样本对应一棵树,那么因变量的值可以为树高。有关样本数据的信息,参见附录中文件格式部分的样地数据文件格式

导入训练数据

参数设置

  • 样地数据:点击样地数据输入框旁边的SelectData ,选择样本数据。
  • 因变量:该参数定义了回归分析中使用的因变量,每次使用一个因变量,可选选项为样本数据中的变量,例如:样本数据中包含样地坐标X、Y和树高三个字段,则因变量的下拉选项中可选X、Y和树高。
  • 样地类型:该参数定义了样地类型,根据样地调查的实际情况进行选择。
    • 正方形(默认):样地为正方形。
    • 圆形:样地为圆形。
  • 长度(米):当样地类型为正方形时,需设置样地的边长。
  • 半径(米):当样地类型为圆形时,需设置样地的半径。
  • 容差范围:模型内部会根据该值搜索满足范围的点,作为测试点,根据内部生成的模型精度选择精度最高的点作为训练样本点。
  • X:样地中心坐标X。
  • Y:样地中心坐标Y。

自变量

可以导入CSV格式数据或者是TIF数据。其中CSV数据格式中必须包含X,Y,XSize,YSize四个字段信息,并且每列信息会作为自变量添加到列表中,注意的是只能添加一份CSV数据;而TIF数据可以添加多个,每个添加成功的TIF数据,都会以它的文件名作为自变量添加到列表中。在自变量选项中,选择在回归分析中用到的自变量(了解每个自变量的更多信息,请参考高度变量强度变量郁闭度叶面积指数间隙率)。

自变量

注意:样地数据需要包含在自变量导入的数据范围内;导入的所有的TIF自变量数据的XY范围和尺度必须一致;在导入CSV文件时,会有X,Y,XSize,YSize四个字段作为自变量导入到列表中,最好删除这4个自变量,也可以根据实际情况保留X和Y;在分析过程中,最好样本的数量要大于因变量的个数,否则导致矩阵求解过程中存在无穷解。

results matching ""

    No results matching ""