GIS空间分析作业.docx
- 文档编号:18025495
- 上传时间:2023-08-07
- 格式:DOCX
- 页数:11
- 大小:24.19KB
GIS空间分析作业.docx
《GIS空间分析作业.docx》由会员分享,可在线阅读,更多相关《GIS空间分析作业.docx(11页珍藏版)》请在冰点文库上搜索。
GIS空间分析作业
将高程合并入降雨量的空间插值的地质统计分析方法文章主要讲述三种将数字高程模型合并入降雨量的多元地质统计算法:
局部均值的简单克吕格、外在趋势克吕格和协同克吕格,这些方法所使用的数据来自葡萄牙的一个5000KM2地区的36个采样点所采集的年均降雨量和月降雨量,最终运用交叉验证的方法将三种地质统计算法和高程对降雨量的直接线性回归以及三种单因素的方法:
泰森多边形、反距离平方法和普通克吕格进行比较。
对于反距离平方法和泰森多边形这两种算法来讲,由于忽略了高程和插值点周围站点的降雨量的影响,估计值的误差也就更大,由于强调了降雨量观测点对同一位置高程的空间依赖性,这三种多元地质统计算法明显优于其他插值方法,尤其是线性回归。
最后,在降雨量和高程之间的相关系比较温和的时候(在本研究中小于0.75),相对于线性回归,普通克吕格所产生的值更为精确。
1.序言
在水文分析和设计中,降雨量的测定是十分重要的。
例如,获取降雨地区与空间变异性相关的高分辨率的估计值的能力在确定当地能够引发洪水甚至是山洪的暴风雨显得尤为重要。
若想活得降雨空间分布的精确估计值,则需要一个非常密集的仪器网络来采集数据,同时意味着巨大的安装和操作费用。
同时,对操作人员没有对量具做必须的检查或者对量具的破坏都可能导致采样点密度的降低。
因此,运用周围站点的测量值来估计未采样点的降雨量就显得尤为重要了。
关于降雨量数据的差值已经提出了一些列的方法。
最简单的方法是将最靠近插值点的观测数据赋予这个未采样的地点(泰森,1911)。
这种方法是利用测量点对之间的一半距离的边界的影响在每个测量点的周围对其作一个多边形,因此这种技术被命名为泰森多边形。
尽管这种方法是用来估计地区降雨量的初级的技术,它还是被应用于测量点数据的空间插值。
1972年,没过国家气象服务局发明了一种用周围数据的权重来估计未知区域的降雨量的方法,该方法所得的权重跟与到未采样点的距离平方成反比关系。
与泰森多边形一样,反距离平方法不允许水文学家考虑类似地形等会对量具的捕获量产生影响的因素,等雨线方法的出现就是为了克服这种不足。
这种方法是利用每个量具所在的位置及其捕获量,同时考虑各种因素对捕获量的影响,来作出平均降雨量的线。
而未采样点的降雨量的估计值就是利用等雨线内的插值取得的。
这种方法一个很大的限制就是:
如果想取得十分准确的等雨线,就必须布局广泛的采样点网络。
因为可以利用邻近观测值的空间相关性来预测未采样点的属性值,基于区域化变量的地址空间统计分析方法近年来愈发地得到青睐。
有些学者已经证实了地质空间统计分析方法(克吕格方法)能够取得比常规方法更好的估计降雨值。
最近,根据Dirks等人的发现,在基于采样点密度的基础之上,比如高分辨率的网格(比如在35KM2的范围内设置13个雨量点),克吕格方法并没有显示出比其他简单的技术(如反距离平方法)更优越的预言性。
当Borga和Vizzaccaro于1977年比较适合于不同雨量点密度的克吕格方法和复二次表面函数的方法的时候,他们也得到了类似的结论。
实际上,除了可以提供一种可以测量的预期误差(克吕格放方差之外),克吕格方法相对于其他简单方法的一个主要优势是采样密度更高的辅助变量可以作为采样密度相对较低的主变量的补充。
对于降雨量来说,天气雷达的观测值就可以拿来作为辅助变量。
作为克吕格方法的一种延伸,同位克吕格已经被用来合并雨量数据和雷达降雨数据。
Raspa等人利用另外一种地质空间分析方法——外在趋势克吕格来结合这两种类型的信息。
在这篇文章中,数字高程模型作为一种更有价值而且更便宜的信息而被引用了。
由于山地地形的影响,空气被垂直抬升之后,由于绝热冷却而被缩合,因此降雨量有随着高程升高而升高的趋势。
比如,根据Hevesi等人的报告,根据内华达州及加利福利亚州的东南部的62个观测点所取得的数据,年降雨量和高程之间具有0.75的显著的相关性。
在这篇文章中,他们运用了克吕格方法的一种多元化的版本——同位克吕格来将高程插值到降雨量的图中。
另一种更为直接的方法是通过降雨量与高程之间的回归来估计一个DEM栅格单元的降雨量。
在这篇文章中,我们运用了两种方法来对葡萄牙的阿尔加夫地区的年降雨量和月降雨量进行插值:
(1)只运用36个采样点的采样数据的方法(泰森多边形、反距离平方法和普通克吕格);
(2)将数字高程模型和降雨量结合起来的算法(线性回归,局部均值的简单克吕格,外在趋势克吕格和同位普通克吕格)。
运用交叉验证的方法,这三种不同的算法可以显示出降雨量与高程之间的相关性的强度,以及降雨量空间依赖性的类型。
2.案例研究
阿尔加夫作为葡萄牙最南端的地区,拥有约5000KM2的面积。
图1显示了该研究中所使用的每天读取的36个雨量观测站的位置。
从
1970年1月到
1995年3月的月降雨量和年降雨量的平均值,以及一些基本的数据(均值,标准差,最小值,最大值)都已经给在表1之中了。
随后的研究将用平均数据来进行,因此月降雨量和年降雨量在年际之间的波动值也就不予考虑了。
另一种类型的信息数据就是表2显示的高程图。
每一个栅格都代表1KM2并且它的高程是通过该山栅格内的四个离散点的平均高程来计算的。
该地区的地势起伏主要是由位于左边的Monchique山和右边的Caldeirao山来决定的。
表1显示降雨量与高程之间的相关度在0.33到0.83之间,因此我们可以将详细的次级信息考虑到降雨量的图中。
由于高程的控制,降雨量的空间分布阐释了月降雨量之间的从适度的到强烈的相关性,见表2。
除去7月和8月这两个干旱的月份,相关系数在0.5到0.97之间变化。
表2显示的是,排除7月和8月之后,一定时间间隔的月份之间的相关系数的平均数。
表3显示的是,在两个连续的月份之间测得的降雨量的平均相关系数是0.9,随着间隔的增大,相关系数略微降至
0.8.
3.插值过程
这一个单元主要介绍了该研究中应用的不同的估计方法。
有兴趣的读者可以参考不同克吕格算法的详细描述。
3.1单因素估计
首先考虑的问题是仅仅运用降雨量的数据来估计未采样点u的降雨量z。
利用36个采样点的数据来构成一个采样点的数据集。
最直接的方法就是泰森多边形,它所依据的原理是将最近的采样点的数据赋值给u。
图4(第2幅图)显示的是降雨量数据在与高程模型的分辨率相对应的1×1KM2的节点栅格的插值图。
这幅图显示了在36个测量点周围的特征多边形区域的影响。
为了避免这种不切实际的片状地图,降雨量z可以用周围几个观测点数据的线性结合来估计,它的权重与观测点到u的距离平方是成反比的。
图4(第三幅图)显示的是在周围观测数据n=16的情况下运用反距离平方法所得到的年降雨量的图形。
权重方案背后一个最基本的观点就是,对地面上的观测点而言,相近者的相似程度比相远者要高,因此更靠近u的观测值应该得到一个更大的权重。
地质空间分析方法运用半方差而不是欧几里得距离来测量观测点之间的相异性。
实验所得的半方差是根据数据对组件之间的平均不同的平方的一半来进行计算的。
公式中N(h)是与h相离的数据对的空间信息的载体。
半方差同时具有地域性和指向性的功能,因此它可以被用来当做方向依赖性的变量(各向异性的空间模式)。
图5(顶部图形)显示的是由图4中的36个数据计算得来的年降雨量的半方差,因为缺乏数据,只计算了全向性的半方差,因此假设各向的空间变异性都是相同的。
随着间隔距离的增大,半方差值也会增加,给我们直观的印象是地面上两个更相近的降雨量数据更相似,并且它们的平方差异比相远者更小。
在一个岩床值产生浸渍和波动之前,半方差在25KM处取得了最大值,这种“孔效应”比较典型地反映了伪周期或者周期现象。
在本研究中,孔效应与相距40KM的两座山所产生的降雨量的两个高值区域有很大的相关性。
克吕格方法是一种在进行空间预测的时候可以考虑观测值之间的空间相关性的广义的最小平方线性技术,这可以由半方差显示得来。
大多数的地质空间分析方法都是基于随机作用的理念之上的,意思就是这一系列的未知点的值都被当做是具有空间依赖性的随机变量。
每一个测量值z(u)都被解析成为随机变量Z(u)的特殊实现。
像反距离平方法一样,运用地质空间分析插值方法来估计未采样点的降雨量z是通过对未采样点u周围的观测数据的线性结合来实现的。
如此定义普通克吕格的权重的目的是使估计的方差最小,同时要保证估计值的无偏性。
通过解“普通克吕格系统”中的一系列的线性方程可以活得这些权重。
式中u(u)是用来约束这些权重值的拉格朗日参数。
克吕格系统需要的唯一参数就是伴随着被实验数据修正过的半方差模型所派生的不同间隔期的半方差值。
图5显示的是结合了块金效应模型并且被年降雨量的实验半方差修正过的三种不同类型的可以承认的模型。
1.伴随着距离a的球状模型
2.伴随距离a的xx模型
3.挫伤xx效应模型
球状模型是最为广泛应用的半方差模型,其特征是由初始值的线性行为决定的。
立方体模型显示了初始数据值的抛物模型,由于它可以避免克吕格系统中的数字的不稳定性,它更受高斯模型的青睐。
尽管在很短的距离内得不到降雨量变化的直接信息(第一个半方差的值出现在5.9KM的距离间隔内),但是像纬度一样与主变量相关并且具有更详细的半方差的辅助信息显示我们可以预测第一个间隔内的抛物行为。
注意在初始值附近的十分规律的行为可以通过块金效应与初始值结合起来,后者可以显示持续叠加在底层上的测量误差。
而最后一种用孔效应来做模型的功能类型就更为复杂了。
这三种模型都已经通过回归修正并且希望实验半方差和模型半方差之间的平方总权重的差值最小。
为了给最初的间隔和从更多的数据对计算而来的点赋予更多的重要性,权重值的形式为。
相对于挫伤孔效应模型而言,立方体模型给出了最小的平方总权重同时需要更少的参数,因此立方体模型得以保留。
通过每个栅格节点附近最接近的16个观测点的观测值来计算立方体的半方差,我们用普通克吕格生成了图4底部的降雨图。
同反距离平方法一样,这样生成的降雨图显得很粗糙,它更加强调更密集的采样点的信息的重要性,如同图2的数字高程模型一样。
3.2考虑高程的情况
现在考虑这样一种情况,用所有可能得到的估计栅格节点的高程值来补充降雨量数据,将高程数据记为y(u)。
一种最直接的方法包括预测在同一地点的高程对降雨量的作用,例如用线性相关性,这两个回归系数a0和a1是从由降雨量和高程共同组成的点集估计而来的。
例如,通过计算,年降雨量与高程之间的关系模型为,生成的降雨量图如图7的顶部所示。
这种回归方式的一个最主要的缺陷是,对于一个特定的栅格节点u而言,降雨量数据仅仅是由u所在的高程派生而来的,而没有考虑周围雨量计的观测值的影响。
这种方法是在假设剩余的值在空间上是不相关的基础上来获取数据的,而接下来描述的三种地质空间分析方法则考虑了剩余值或者降雨量观测值之间的空间相关性。
不同地区局部均值克吕格是利用将已知区域的均值赋给通过次级信息派生而来的简单克吕格的估计值来获取数据的,如果局部均值是由公式10的关系模型派生而来的,那SKlm的估计值就可以定义为回归估计值和SK利用剩余值在u点的估计值之和,解简单克吕格方程组可得系数,CRH是剩余的RF的协方差,而不是ZU本身的。
如果剩余值是不相关的,则对任意H,CRH=0,这样方程12中所有克吕格洗漱均为0,而SKlm的估计值都是由线性回归提供的,不同于普通克吕格方程组5,因为没有克吕格权重的约束,简单克吕格方法可以用协方差的形式表现出来。
然而,通常的经验是先估计半方差VRH,并用之建模,然后用公式来检索CRH,大部分的地质统计分析方法都有自动将半方差转换为协方差的功能,因此用户只需要提供半方差模型即可。
例如图8现实了利用修正模型所得剩余降雨量的半方差,并用这个模型生成了图7所示的降雨图(第二幅图)。
相对于线性回归所生成的降雨图中只是对高程模型的一个缩放而言(图7,顶部的图),这种模型生成的降雨图更加肯定了高程的影响。
如同SKlm方法一样,外在趋势克吕格用次级信息来派生主变量z的局部均值,然后用剩余值的相关性来产生简单克吕格,式中:
估计式11与15只是对局部均值或局部趋势的定义不同而已。
在SKlm方法中,趋势系数a0和a1是伴随着独立的克吕格方程组派生的,而KED方法中回归系数a0和a1是通过每个估计点邻近区域所产生的克吕格方程组而间接地估计出来的。
换言之,高程与降雨量的关系只是在局部计算的,这就使我们可以计算整个研究范围内相关性的变化,出于解释的目的,我们可以计算a0和a1并用之制图,但当做估计的时候这两个系数是不必要的,而KED估计值的通用和等效的表达式是:
此处的克吕格洗漱是n(u)+2个线性方程组的解。
U0和u1是为了限制这些系数而产生的两个拉格朗日参数。
值得注意的是高程数据y参与了克吕格方程组,但是它们并没有包含在估计式15之内。
图7(第三幅图)显示的是通过KED估计而得年降雨量图,它与SKlm图看起来十分相似。
另一种纳入次级信息的方法是同位克吕格,它是克吕格方法的一种多元延伸。
当辅助变量在多地的取值都已知并且在研究区域内是光滑变化的,如果辅助数据与被估计点u的高程是相同的,同位克吕格系统中则只有少许损失。
当然,同一位置的高程似乎掩盖了更远的高程数据的影响。
因而距离更近的高程数据之间的相关性比相距甚远的降雨量数据的相关性大得多,因此运用多元的二次数据可能导致不稳定的克吕格系统。
同位克吕格的估计表达式为:
式中mz和my是降雨量和高程数据的整体均值,见表1。
公式17的第二种形式反映了为了保证估计值的无偏性而显示的辅助变量(高程)的缩放对主变量(降雨量)的均值的响应。
同位克吕格与之前两种地质统计分析方法最主要的区别在于高程数据的处理方式。
鉴于高程数据有直接影响同位克吕格的估计值,而SKlm和KED方法中高程只是提供了在u地点高程影响主变量发展趋势的信息。
同位克吕格系数是以下n(u)+2个现行方程组的解,式中RZY是主变量与辅助变量在相对地点ua和u处的交叉半方差值。
图9显示了实验测得的高程和年降雨量的半方差,而它们的交叉半方差可以计算如下:
值得注意的是,为了避免在随后的直接半方差和交叉半方差在建模过程中可能产生的不一致性,仅仅运用36个气象站点的高程数据,而不是图6显示的整个DEM数据来计算高程的半方差。
通过Goulard发明的一种迭代程序修正了一种合作区域化的线性模型。
这三种半方差可作为同一系列的基本模型(此处有块金效应和范围为29.18km的立方体模型)的线性结合的修正模型。
同时,在岩床矩阵的积极半确定性的约束下,WSS标准是最小的。
图7(底部图形)显示的是用同位克吕格估计的年降雨量的图形。
不同于先前的三种方法,该降雨图中并没有显示出高程图的详细信息,并且它与图4底部的普通克吕格图形具有更多的相似之处。
4.4不同插值方法的评价
运用交叉验证的方法我们对7种不同插值方法的表现形式进行了分析和比较,这种算法的内容是暂时将某一时刻的降雨量观测值从数据集中移除,然后利用剩余的数据利用替代算法来重新估计这个数据,用均方差作为观测值的对比判据,而均方差就是用来测量真实的降雨量与它的估计值之间的平均平方差。
式中阿尔加夫数据集的n=36.如果算法足够精确的话,这种判据的值应当接近于0,。
对于线性回归而言,它的MSE知识简单地用36个观测值修正的线性模型的剩余值的平均值来进行计算的,那就意味着这种方法下所得的预测值的误差是偏低的。
尽管有泛克吕格插值方法可以提供误差方差的估计值,但是又一些学者提到过,因为它只能对克吕格估计值的可靠性提供有限的信息,所以它没有作为一种表面判据方法而被保留下来。
在前面所提到的并用来说明年降雨量的插值方法,同样被运用到月降雨量数据中。
例如,图10显示的是在4个最湿润的月份中原降雨数据和剩余值之间的半方差,由于降雨量在空间分布上的互补的控制,尽管各月份之间块金效应和立方体模型的范围有一定的波动,它们的半方差也有相似的形状。
同样是对这4个月而言,图11显示的是普通克吕格方法估计而得来的图形,为了便于进行灰度图的比较,每个月份的数据都被平均地分成了6个等级,尽管它们的半方差是相似的,各降雨量之间还是显示出了些许的差异性:
在2月和12中,西海岸所记录的降雨量最小,而在4月和10月,高降雨值的栅格就移向了西部了。
图12显示的是月降雨量和年降雨量运用7中插值算法获取估计值所得的均方差。
结果是以与线性回归方法的预计误差的比值形式表现出来的,因此用这些比重乘以表1中的值就可以轻易检索出它们的绝对数据,所得的结论如下:
1.忽视高程的三种算法会产生更大的估计误差,其中泰森多边形的结果最差,值得关注的是有几个月以及对于全年的平均值而言,普通克吕格产生的降雨对于高程的估计值误差比线性回归的要小。
2.除去六月到九月几个具有低降雨量特征的时期,多元的地质空间分析算法比无事周围气象站点所提供的信息的线性回归方法表现得要好。
3.在考虑高程的地质空间分析算法中,局部均值的简单克吕格和外在趋势克吕格产生的结果比更复杂的普通同位克吕格略好。
为了确定可能对相对预期表现有作用的因素,MSE比例值对参数的平面图已绘于图上,如降雨半方差的相对块金效应,剩余值半方差的相对块金效应,以及降雨量和高程之间的相关系数。
第一幅散布图显示的是,由于观测值之间的空间依赖性降低了,相对于反距离平方法而言,运用普通克吕格方法的利益就降低了,而这是由降雨半方差的一个更大的相对块金效应显示出来的。
类似地,如图13右部顶图所示,由于剩余数据之间的空间依赖性降低(剩余半方差的块金效应变大),相对于计算高程的线性回归方法而言,运用地质空间统计方法(SKlm)的利益也降低了。
图13中间的两幅图显示的是降雨与高程之间的相关性的强度对普通克吕格与同位克吕格的相对表现(左图)和普通克吕格与线性回归的相对表现(右图)的影响。
需要注意的是,因为夏季月份对降雨量数据的贡献是微不足道的,因此夏季月份所观测到的最小的相关系数并没有被考虑在其中。
因为高程为降雨量带来了更多的信息(产生更高的相关系数),普通同位克吕格相对于克吕格产生的增益是增加的,另一幅图显示的是在高程与降雨量之间的相关性是之中的(p<0.75)且周围监测点的信息是值得整合的时候,普通克吕格比线性回归产生的效果要更好,对于更大的相关系数而言,由于在估计值栅格节点的高程值掩盖了周围站点的降雨数据的影响,因此它的空间信息就显得不那么有用了。
Goovarets说明了辅助信息对同位克吕格估计值的贡献不仅依赖于主变量与辅助变量之间的相关性,同时有也依赖于它们空间连续性的模式。
因为主变量半方差的相对块金效应增加了,主变量数据的噪声度增加,因此携带了更少的信息,同时辅助数据的权重增加,尤其是交叉半方差和辅助变量的半方差有一个很小的相对块金效应的时候,由于高程的半方差具有一个典型的很小的块金效应,由图13底部图形证实,我们可以预测相似的结果。
由于观测值之间的空间依赖性降低了,普通同位克吕格相对于克吕格方法的获益也就增加了,这也由降雨量半方差的更大的相对块金效应显示出来(忽略7月和8月结果的中间图形)。
5.结论
我们的结论证明了之前的发现:
对于低密度的雨量计网点而言,地质空间插值方法是优于忽略为降雨数据而采集的空间依赖性类型数据的诸如反距离平方法、泰森多边形等方法;克吕格估计值的均方差最多只是反距离平方法的一半。
如果诸如数字高程模型的辅助信息可以纳入考虑范围的话,估计值的精度可以更加被提高。
这篇文章回顾了插入如此详细的辅助信息的不同地方,并且通过交叉验证显示了在不同的算法之间,估计值的表现可能有很大的不同。
通过同位的高程直接派生降雨量数据最直接的方法是线性回归,对于这种方法而言,当两种变量之间的相关性不是太强并且剩余值在空间上是相关的时候,周围气象站点的数据对于插值是至关重要的,而线性回归就忽略了这样的信息。
在这个研究的案例中,当相关性小于0.75时,忽略高程和空间相关性来插入相关的剩余值的简单方法是运用地质空间统计方法,也就是用局部均值的简单克吕格(SKlm)。
对于大多数月份来说,SKlm方法的估计值所产生的均方差最小,所以它的效果要比在每一个观测点周围都分析高程与降雨量之间的相关性的外在趋势克吕格方法(KED)更加好。
最后一种方法是同位克吕格,它是以对某一点周围的降雨观测值以及改点处地高程的线性结合来对该地的降雨量进行插值的,因为它要推断、联合三个半方差数据并用之建模,因此这种方法的技术要求是最高的,而近期发展的自动修正程序可以在一定程度上减轻这个任务。
相对于受DEM模式影响很大的SKlm和KED图形而言,同位克吕格图形显示的细节更少,在本研究中,同位克吕格所增加的复杂性并没有降低估计值的误差,所产生的误差比SKlm和KED产生的更大。
以后的研究应该分析允许我们阐释的在空间变量中占更大比重的其他由降雨量显示的环境描述性因子,例如距海的距离或者坡向等。
然而同位克吕格和多元的外在趋势克吕格应用起来较为复杂,而SKlm提供了一种合并几个辅助变量的简单方法,并且在这个数据集合中,它所产生的估计值是最好的。
在本案例研究中,综合多种结合高程的多元地质统计分析方法,当相关系数大于0.75的时候,SKlm、KED和OCK方法所产生的估计值误差是小于OK方法的。
Asli和Marcotte也于1995年报道了相似的相关性的限制,他们更深入地总结了只有相关系数在0.4以上的时候,估计值的辅助信息才值得被介绍。
如果降雨量和高程(或者其他环境描述性因子)的相关性太小的话,多元技术的效应就会显得很边际,因为它有可能是降雨量在很短的时间梯度内的积累。
出去高程与降雨量之间的相关性之外,观察空间连续性的形式也是十分重要的。
高程数据与降雨量的相关性适中的时候(例如相关性在0.4到0.7之间),它所显示的相对块金效应比降雨半方差的要小很多,运用同位克吕格方法它仍然可以提升估计值的精确性,尤其是当降雨量和高程之间的交叉半方差的块金效应很小的时候。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GIS 空间 分析 作业
![提示](https://static.bingdoc.com/images/bang_tan.gif)