实验室在GPU+CPU并行加速的高光谱遥感图像集成分类方面获进展

时间:2021-03-08 首页 >> 新闻动态
        遥感图像监督分类是遥感图像处理与应用领域中的一个重要分支,为获取精确的语义分类结果研究人员们已经做了大量的工作。其中,分类算法设计与应用是重要的一个方向。鉴于跟传统的基于模型的方法相比,机器学习算法在处理高维度、复杂特征空间、多时向及大覆盖范围遥感图像处理方面更具有优势。其中,又以具有算法简便、执行快速及性能稳定等优势的决策树集成算法最为普遍。
        在以决策树集成分类算法家族中,梯度提升树(GBDT)及其变体因具有算法性能优良、可使用多种损失函数及满足严格的数学可揭示性等优势今年来引起了研究人员们的广发兴趣。CatBoost集成算法作为最近提出的一种有序梯度提升树(OGBT),在高光谱、全极化SAR等遥感图像分类任务中表现出比梯度提升树(GBDT)、极端梯度提升树(XGBoost)及轻量级梯度提升树(LightGBT)更加优秀的性能,但其算法执行效率明显低于GBDT、XGBoost。
        在高光谱遥感图像分类任务中,人们通常采用特征提取、特征(波段)选择等降维方法已避免可能面临的Hughes现象。在集成学习中,特征提取、特征(波段)是常用的多样性构建方法。但跟特征提取方法相比,特征(波段)方法的物理意义更加明确且能保证原始信息,且算法执行效率高。因此跟特征提取方法相比,特征(波段)方法更适用于集成方法的构建。跟诸多特征选择方法相比,基于互信息的最大相关最小冗余(mRMR)方法在基因表达、蛋白质分类、3D表情表达、肺癌识别及水资源管理等领域中表现出优良的性能(2020年引用率在8000次以上),但mRMR特征选择方法的性能在遥感图像处理中并未引起足够重视。为了进一步提升mRMR特征选择方法连续、离散及类别数据上的性能,人们提出了其集成形式,即最大相关最小冗余集成(mRMRE)。但原始mRMR特征选择方法的低效率特性(算法复杂度与样本大小、数据维数成线性正比),在其集成形式中被进一步放大而不适用于大体量数据的处理。为此,人们基于CPU并行计算、GPU等平台提出了诸多加速形式,但以上mRMRE的并行加速方法并未引入到高光谱遥感图像分类或是集成系统构建任务中。
        为此,实验室中亚湖泊环境与地表过程团队成员阿里木·赛买提博士以CatBoost集成算法的GPU加速实现算法效率提升,以CPU并行加速实现mRMRE特征选择算法的效率提升为主要技术手段,并采用集成学习中的Meta集成方法将多个GPU加速的CatBoost集成算法进行二次集成,提出了CatBoost集成森林算法,并成功应用与高光谱遥感图像的高精度、高效率分类。
        相关研究成果以“GPU-Accelerated CatBoost-Forest for Hyperspectral Image Classification via Parallelized mRMR Ensemble Subspace Feature Selection”为题发表于遥感领域权威期刊IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing上。研究得到了国家自然科学基金面上项目、中国科学院青年创新促进会等项目的资助。文章链接:https://ieeexplore.ieee.org/xpl/RecentIssue.jsp?punumber=4609443。 

 



附件下载:

版权所有:荒漠与绿洲生态国家重点实验室 Copyright.2022 电话:0991-7823174 E-mail:pantt@ms.xjb.ac.cn
地址:中国·新疆乌鲁木齐市北京南路818号 邮编:830011 新ICP备06001700号-17 新公网安备 65010402001676号