其他新闻

其他新闻

出售关键词排名单位矩(宁波关键词排名单位)

时间:2023-11-10 信途科技其他新闻

原创 黄 健等 南京林业大学学报

专题报道

基于多源数据及三层模型的区域优势林种识别

黄 健,吴达胜,方陆明

浙江农林大学 数学与计算机科学学院,林业感知技术与智能装备国家林业和草原局重点实验室

传统的森林资源调查以实地调查为主,不仅需要大量的人力、物力、财力,而且调查周期长,难以满足森林资源动态监测的需求。当然,传统的地面调查可为森林资源调查提供客观可靠的数据,再结合遥感影像和机器学习方法,可以提高森林资源监测的时效性、降低监测成本。近年来,光学遥感影像数据在林业资源监测中备受关注。

李煜等、张悦楠等、蔡林菲等使用遥感影像结合机器学习的方式对树种进行了识别,均得到了可观的总体识别精度,3个研究结果均表明光谱信息是决定树种识别精度的主要特征变量。随着遥感技术的迅速发展,将光学遥感影像与雷达遥感影像相结合的方法在森林资源监测中的使用也越来越广泛,且在树种识别方面取得了较好的效果。王瑞瑞等使用机载多光谱数据与雷达点云数据,结合RF,SVM与ANN进行树种识别,总体精度达到了86.19% ;徐逸等采用XGBoost算法,以机载高光谱数据与雷达数据对红树林树种进行了分类,总体精度达到了96.74%;皋厦等结合LiDAR与高光谱数据,使用RF算法构建树种识别模型,总体精度达到了91.30%。Persson等使用Sentinel-2影像数据,结合RF对瑞典常见树种进行分类,总体精度达到了86.30% ,研究表明近红外波段对树种的识别有重要的作用;Ginaelle等使用高光谱与多光谱数据融合激光雷达数据对南阿尔卑斯山区域特兰托的部分区域进行树种识别,经对比实验发现,高光谱数据结合激光雷达数据与多光谱数据结合雷达数据在对“森林”“非森林”和"阔叶林”“针叶林”“非森林”这两种宏观分类上没有明显差距,但在对树种进行精细分类时,高光谱数据结合激光雷达数据的效果更优。

淳安县中的主要树种结构为阔叶林与针叶林,其中阔叶林中包含阔叶混交林、其他硬阔林、山核桃林(Carya cathayensis) ,针叶林中包括杉木(Cunninghamia lancelata)与马尾松( Pinus massoniana ) ,这些树种起到了保持水土、调控天气以及维持生物多样性等作用,同时也为人类生产生活提供了丰富的原材料,为可持续发展提供了坚实的物质基础。毛竹(Phyllosstachys heterocycle)与茶叶林(Camellia sinensis)是研究区中经济林的重要组成部分,并带来了较可观的经济效益。通过对经济林的分布识别可以更方便地进行资源规划,对研究区域的经济发展具有重要意义,故本研究将经济林作为树种结构识别目标之一。

综上所述,关于优势树种识别的研究区域主要集中在林场或森林且都获取了较高的识别精度,但对于大范围内的优势树种识别研究较少,模型的泛化能力不够,为了进一步提高区域森林小班优势树种识别结果的可靠性与模型的泛化能力,并获取较高的识别精度,本研究集成Sentinel-2和 Senti-nel-1遥感影像、数字高程模型(DEM)和森林资源二类调查数据,将模型分为3层:首先使用RF建立林地识别模型,再使用RF、XCBoost 、LightGBM建立树种结构识别模型,最后一层根据树种结构识别模型的识别结果,使用LightGBM进行优势树种识别,这是一个逐步求精的过程。本期论文推荐的作者采用3层模型结构对大范围内的优势树种进行识别,以期获取相较于传统的单层模型更高的精度。

下面跟学报君一探究竟!

作者简介

通讯作者

吴达胜,男,1972年11月生,浙江省优秀科技特派员,高级程序员、数据库高级管理工程师。

第一作者

黄健,男,1997年10月出生,浙江农林大学农业工程与信息技术研究生。

关键词:林种识别;光学遥感;雷达遥感;数字高程模型;模型分层

基金项目:浙江省科技重点研发计划资助项目( 2018CO2013)。

引文格式:黄健,吴达胜,方陆明.基于多源数据及三层模型的区域优势林种识别[J].南京林业大学学报(自然科学版),2022,46(1):77-87.HUANG J,WU D S,FANG L M.ldentification of regional dominant tree species based on muli-source data andthree-tier models[J].Journal of Nanjing Forestry University (Natural Sciences Edition), 2022,46(1):77-87.DOI:10.12302/j.issn.1000-2006.202109037.

1目的

目前关于林种识别的研究区域主要为小范围森林区域和林场,为了探究较大范围内树种的识别方法,本研究使用Sentinel-2光学遥感影像、森林资源二类调查数据﹑数字高程模型(DEM)和Sentinel-1雷达遥感影像数据建立树种识别模型。

2方法

以淳安县作为研究区域,针对淳安县的7类优势林种:毛竹(Phyllosstachys heterocycle)林、茶树林、山核桃(Carya cathayensis )林、杉木(Cunninghamia lanceolata)林、马尾松(Pinus massoniana)林、阔叶混交林(Camellia sinensis) 、其他硬阔林进行识别。研究采用分层的方法对优势树种进行识别,整体分为3层。第Ⅰ层使用RF算法建立林地与非林地识别模型;第⒉层对林地数据进行树种结构识别,分别使用随机森林(random forest,RF),极端梯度提升(eX(treme gradient boosting,XGBoost)和轻量级梯度提升机(light gradient boostig machine, LightCBM)方法建立不同模型并对比分析实验结果;第3层将林种结构的细分为优势林种类型。

2.1 试验材料

研究区域为浙江省淳安县(118°20'~119°20'E,29°11'~30°02'N)(表1),位于浙江省西部、杭州市西南部丘陵山区,白际山脉和千里岗山脉之间,新安江和千岛湖交汇之处,四面多山,中为丘陵,略呈盆地状,属北亚热带季风气候区。陆域面积4 417.48k㎡,是浙江省陆域面积最大的县。淳安县中部是千岛湖区,生态环境较好,拥有33.332万h㎡的森林面积,覆盖率高达75.27%。其中,包括了阔叶混交林、其他硬阔林、山核桃林、马尾松林、杉木林、毛竹林、茶树林这7类势林种。

▼表1 树种结构分类及样本数量

2.1.1 自变量提取

2.1.1.1 光学遥感因子

光学遥感因子包括了光谱特征因子和纹理特征因子。

光谱特征因子:在 Sen2Cor 插件与SNAP软件中经过预处理将影像转为ENVI格式,去除Sentinel-2遥感影像中分辨率较低且与实验关系不大的3个波段(Band1 为海岸/气溶胶波段, Band9为水蒸气波段,这两个波段对于本研究的意义不大,而Band10为卷云波段,获取的是大气顶部的反射率,并不是地表的反射率,在Sen2Cor插件中的大气校正步骤中自动删除),剩余10个波段,外加计算得到的4个植被指数:比值植被指数(RVI)、增强型植被指数(EVI)、差值环境植被指数(DVI)、归一化植被指数( NDVI)[5,4]以及6个光学波段组合因子,共计20个光谱特征因子作为自变量(表2)。

▼表2 光谱特征因子

纹理特征因子:基于Sentinel-2光学遥感影像中空间分辨率最高(10 m)的 Band2 、 Band3 、 Band4和 Band8进行主成分分析,并选取第1主成分进行计算纹理特征值。在遥感影像的研究中,使用的滑动窗口大小一般不大于51×51像素,所以本研究共使用了13个大小为3×3像素至51×51像素之间,方向为135°,且移动步长为1像素的滑动窗口进行对比。各个窗口提取均值(mean)、同质性(homogeneity)、嫡(entropy)、非相似性(dissimilari-ty)、对比度(contrast)、相关性(correlation)、方差(variance)和二阶矩(second moment)8个纹理特征值参与后续实验。

2.1.1.2 雷达遥感数据提取特征

使用SNAP软件对Sentinel-1雷达遥感影像数据进行轨道校正、消除边界噪声、去除热噪声、抑制相干斑噪声、辐射定标、分贝化等操作,得到VV(垂直发射,垂直接收,同向极化)和VH(垂直发射,水平接收,交叉极化)两种极化方式的后向散射系数,并将VV和VH进行相减和相除,共得到4个雷达遥感因子。

2.1.1.3 地形特征提取

将获取的4景DEM 在ArcGIS中进行坐标系转换、拼接和裁剪后,提取研究区域的海拔、坡度、坡向这3个地形因子。

2.1.1.4 森林资源二类调查数据

从森林资源二类调查数据中提取各个小班的土层厚度、腐殖质厚度作为特征因子,并将其所对应的树种结构与优势树种作为模型标签,用于模型精度的验证指标。

腐殖质厚度二类数据中的表示为:薄、中、厚。由于这两个特征因子并没有详细的数值且相互之间存在递进的数学关系,本研究采用了标签编码的方式(薄编码为0;中为1;厚为2)。土层厚度在二类数据中有具体的数值表示,故不需要进行编码。

综上所述,本研究共使用到37个特征因子,其中光谱特征因子20个,纹理特征因子8个,雷达遥感因子4个,地形因子3个,森林资源二类调查因子2个。

2.1.2 总体路线

以小班为研究单元,集成Sentinel-2 , Sentinel-1、DEM及森林资源二类调查数据,提取自变量因子数据,并将各个因子使用不同的组合方式进行建模。第1层模型使用RF模型识别林地与非林地;第⒉层使用RF、XGBoost 、 LightGBM模型识别林地的类型;第3层使用上层中的最优方法结合雷达遥感数据识别优势树种。

具体流程如图1所示。

▲图1 实验流程图

2.2 研究方法

1)随机森林(RF)。使用Boostrap重采样算法对原始数据集进行有放回的横向欠采样与纵向欠采样,得到若干份数据集。使用每一份训练集训练一棵决策树,所有的决策数据集成后称为随机森林,最终的分类结果由各子树投票进行决定,得票数最多的识别结果作为随机森林的最终结果。本研究设置了最大特征数为总特征数量的平方根,子树的数量设置为250棵。

2)极端梯度提升(XGBoost )。该算法的基础学习器之间存在线性的相关性,通过特征预排序机制,减少了迭代过程中的计算量,每次迭代对残差进行拟合。基学习器采用了与RF相似的特征降采样,降低过拟合的风险。XGBoost模型采用决策树作为基学习器,子树数量设为250棵,最大深度为6,每棵决策树使用80%的训练集样本与80%的特征进行构建,学习率默认为0.3。

3结果

第Ⅰ层RF林地与非林地识别模型总体精度为98.08%;第2层林种结构识别模型中对比了3个模型不同特征组合下的性能,其中LightCBM模型总体精度最高,达到了81.43% ;第3层模型对优势林种进行识别,基于所有特征结合雷达遥感因子建模的情况下, LightCBM模型精度为84.51% ,经递归特征消除法(recursive feature elimination,RFE)选择特征后,最优精度为83.21%。

3.1 林地与非林地识别

林地与非林地识别模型的分类结果如表3所示。从分类结果上看,SMOTE过采样可以使第一层模型的总体精度达到最高,其中测试集识别结果混淆矩阵如图2所示。

▼表3 不同过采样算法下的RF模型精度

▲图2 林地识别结果混淆矩阵

3.2 树种结构识别

将第1层模型中识别结果为林地的数据进行筛选后,利用RF、XGBoost、LightGBM这3种算法,使用如下4个自变量组合方案进行建模。方案1为光谱特征因子;方案2为光谱特征因子、森林资源二类调查因子;方案3为光谱特征因子、森林资源二类调查因子、地形因子;方案4为光谱特征因子、森林资源二类调查因子、地形因子、纹理特征因子,其中前3种方案得到9种建模结果。测试数据在9个模型上的精度表现,如表5所示。

▼表4 基于3种自变量组合方案及3种分类模型的精度比较

对比表4中的9个实验方案的总体精度,可以发现, LightGBM模型方案3的结果最优,其总体精度达到了80.76% ,且计算所需的时间也远少于RF和XGBoost模型,表现最佳。

基于LightGBM模型方案3,再加入13个不同大小的窗口获取的纹理特征(方案4),进一步评价LightGBM模型的精度(如表5所示)。由表5可知:在窗口大小为7×7时, LightGBM-4树种结构的总体识别精度最高,达到了81.43%。

▼表5 LightGBM方案4的模型识别精度

▲图3 基于RFE和LightGBM方案4的树种结构识别结果混淆矩阵

基于RFE和 LightGBM-4树种结构识别模型中的特征重要性如图4所示,光谱特征中 Band3、Band4 、Band6、 Band11 、 Band12波段和B8A_B7、B6_B5、B7_B6光学波段组合因子在模型中贡献度较高。纹理特征中的mean , second moment 和地形因子中的坡度(slope)、海拔(elevation)的贡献度也较高。

▲图4 基于RFE和LightGBM方案4的树种结构识别模型的各特征重要性排序

3.3 优势树种识别

本研究涉及的优势林种主要有7类:阔叶混交林、其他硬阔林、山核桃林、杉木林、马尾松林、毛竹林、茶树。

构建优势林种识别模型时,特征组合方式使用构建林种结构识别的方案4结合上雷达遥感因子。对于纹理特征处理,采用与树种结构识别模型一样的窗口数量及大小(见表5)评价纹理特征对模型精度的影响,结果见图5。由图5可知,精度较高的窗口大小为23×23、31×31、35×35、39×39、51×51,其中51×51窗口获取的纹理特征使模型精度最高,识别结果混淆矩阵如图7所示。

▲图5 不同大小滑动窗口对应的模型精度

由图6可知:毛竹、茶叶和山核桃林的识别精度较高,阔叶混交林和其他硬阔林的识别精度都比较低,从混淆矩阵中看来,这两类优势树种有比较大的概率被识别成同一类,难以准确地将它们区分开,从而导致总体识别精度下降。针叶林中的识别结果来看,杉木林的识别效果优于马尾松。

▲图6 基于LightGBM-4及雷达遥感因子建模识别结果混淆矩阵

为了进一步研究雷达遥感数据对优势树种识别的影响及分析各自变量因子的重要性,基于表4的第4种自变量因子组合方案,分别使用了3中雷达遥感因子及特征选择方案:方案A为未加入雷达遥感因子进行特征选择;方案B为加入雷达遥感因子进行特征选择;方案C为特征选择后加入雷达遥感因子,利用LightGBM模型识别优势树种,结果见表6。

由表6可知:雷达遥感因子对优势树种识别精度影响不明显。方案B和方案C的特征重要性如图7所示。由图7可知来自光学遥感和DEM的自变量因子比雷达遥感数据获取的自变量因子对模型的精度影响更大。

▼表6 基于LightGBM-4及3种雷达遥感因子及特征选择方案的建模精度对比

▲图7 基于LightGBM的优势树种识别的特征重要性排序

本研究所使用的林地数据为经过拉依达准则筛选后的50 565条数据,在区分了林地与非林地的基础上,对所有林地数据进行了林种结构识别,识别结果如图8( a)所示。所有林地的林种结构识别完成后,将林种结构细分为更精细的优势林种,识别结果如图8(b)所示。

▲图8 淳安县树种结构与优势树种识别结果

由图8可知,本研究采用的方法对于淳安县优势林种有较好的识别效果,整体精度较高。

本研究同时基于LightGBM模型方案4(表4)及雷达遥感因子,构建一层模型直接对优势树种进行识别,识别结果如下所示:一层模型使用所有特征进行建模的总体精度为70.99% , RFE后特征建模精度为68.13% ,模型训练时间为3.72s;三层模型使用所有特征进行建模的总体精度为84.51%,RFE后特征建模精度为68.13% ,模型训练时间为36.68 s。由模型对比结果可知:一层模型的优势树种识别结果相较于3层模型(RF-LightGBM-LightG-BM)而言精度下降非常明显。这表明,3层模型逐步求精的识别方式比一层模型直接识别有更高的精度。

此外,从实验结果中发现,在优势林种识别模型中,阔叶混交林与其他硬阔林两种优势树种区分难度较大,识别精度较低,根据3个光谱特征距离对其进行分析,如图9所示。

林海军等计算了数据间的协方差(马氏距离),获取林种光谱特征之间的相似度,用于确定树种之间差异显著的波段,并剔除差异不显著的波段。在本研究中,通过图9中的3个光谱特征距离的对比可发现,山核桃、毛竹、茶树林的特征距离比其他优势林种的都比较大,说明了这3种优势林种与其他优势林种的光谱特征差异较明显,容易与其他树种区分开,从而获得了较高的识别精度。由于阔叶混交林与其他硬阔林都属于混合优势林种,其中多种树种交混着生长,且研究区域属于丘陵地区,地表有起伏变化较为明显,可能导致了“异物同谱”现象的发生,使模型对其识别难度增大。这2种优势树种的切比雪夫距离仅为15.5,说明两者之间的光谱特征差异非常小,无法找到2个优势林种之间差异显著的波段,这可能是导致两种优势林种识别精度较低的主要原因。

▲图9 各优势林种之间的光谱特征距离

4结论

通过各个模型的特征重要性图发现,光学遥感中的绿光、红光、近红外波段和红边波段,以及DEM提取的地形因子对研究区域小班优势树种识别有比较好的效果,而Sentinel-1雷达中提取的自变量对优势林种的识别没有特别明显的帮助。

关注我们,更多精彩

扫描二维码推送至手机访问。

版权声明:本文由信途科技转载于网络,如有侵权联系站长删除。

转载请注明出处https://www.xintukeji.cn/xintu/64022.html

相关文章

直通车关键词排名下降是什么原因(直通车关键词排名公式)

如果在开淘宝直通车的过程中发现直通车的质量分越开越低,那么淘宝卖家们也需要引起重视,首先需要明白这背后的原因,另外也要学会去做好直通车关键词的养词,我马上给各位分享一些方法和技巧。为什么直通车质量分越...

手机建站软件哪家好(手机免费建站软件)

文章目录 1 10大最佳免费建站软件1.1 1. Site123 –是否像1-2-3一样容易?1.2 2. Wix –国际重量级1.3 3. Weebly –一个缺点很大的网站建设者1.4 4. Uc...

中小企业网络营销方式单一,中小企业网络营销存在的问题与策略

许多中小企业 的网络营销方式是从实体营销中转变过来的,实体营销中采用的那种 满街小广告高强度的电话轰炸被有些中小企业搬到网络营销上来 了,通过。网络营销是一种以互联网为依据,立足于网络媒体与数字化信息...

百度关键词排名用十九金手指(百度关键词排名推广)

《中国经济周刊》 记者 郭志强| 北京报道3月15日,央视315晚会曝光上海顶匠信息科技有限公司等企业为客户制作“万词霸屏”以操纵网络搜索结果,违规操纵搜索引擎的不正当竞争行为浮出水面,舆论哗然。消费...

手机建站模版(肇庆模版建站公司)

手机端网站模板建站因为手机网站具备着访问不受时间空间限制的优势,而且手机网站也能够实现电脑网站的功能,所以企业在进行电。建站之星PC+手机组合精美模板上线看中一个PC模板但对应的手机版在哪呢?组合模式...

和平区龙岗网络推广(龙岗网络推广方式)

和平区龙岗网络推广(龙岗网络推广方式)

深圳龙岗哪个网站优化公司比较好些呢? 1、岚光网络一直致力于品牌网站建设,网站设计制作,精美的页面设计,超底的价格,真诚的服务,打造强势品牌是岚光网络存在的理由。2、整体。关于网站对百度的优化可以访问...

现在,非常期待与您的又一次邂逅

我们努力让每一次邂逅总能超越期待

  • 效果付费
    效果付费

    先出效果再付费

  • 极速交付
    极速交付

    响应速度快,有效节省客户时间

  • 1对1服务
    1对1服务

    专属客服对接咨询

  • 持续更新
    持续更新

    不断升级维护,更好服务用户