How to make high resolution remote sensing image dataset?

github地址
<https://github.com/leeguandong/How-to-make-high-resolution-remote-sensing-image-dataset->

0.引言

根据自身需要制作遥感影像数据还是很具有现实意义:  
第一,高分辨率遥感影像数据集目前整体上是缺乏的,主流的有UC-Merced dataset,WHU-RS dataset,RSSCN7
dataset以及2017年由武汉大学制作的目前最大包括10000张30类的高分影像的AID数据集。  

第二,主流数据集缺乏地区特点,比如针对合肥地区的地物做分类,我希望的我数据集尽可能接近我可能使用的测试数据集。人工制作数据集的工作量虽然比较大,但是结果会相对准确。
第三,扩充地物类型,AID数据集目前也只有30类,地物类别缺乏。



第四,设计高分遥感数据集,更有利于模型训练,遥感影像数据集必须要面临的一个很重要的问题就是标签样本数据缺乏的问题,相对来说,使用迁移学习的预训练模型效果会好一些,我使用过的Inception-v3做高分分类效果就很好。

1.制作流程

1.1 目标地区的遥感影像获取

使用LocalSpaceViewer来获取谷歌影像数据:  




下载类型选择谷歌影像,这个影像是多个数据源的叠加影像,更准确。

下载级别建议采用16,这样分块后的图片大小是256*256,是非常适合做场景数据集的。

截取区域的选取和要分类的数据源以及要分类的类别有关。

1.2 遥感影像的选取原则
1.Higher intra-class variations  
2.Smaller inter-class dissimilarity  
3.Relative large-scale dataset  


以上三个原则是我们选取分类场景影像最重要的指标,也就是类间的差距要小,类内的差距要大,另外就是相对比较大的标签数据量,这三个同时考虑了模型的泛化能力。




Buildings(类内差距要大)



                                              Greenbelt                       
   Water                             Farmland

类间差距要小,类间相似性要高




1.3  标签分类与图片编号

尽量多分类,我这次做的合肥地区的遥感影像数据集并没有做很大,只有5类地物,每类100张左右。

图片编号可使用FasStone Image View进行统一名称替换就可以。







至此就完成了数据集的制作,自制的高分影像数据集对于我们做特定地区的图像分类问题很有意义。

我制作的合肥地区的高分辨率遥感影像数据数据集在我的github
<https://github.com/leeguandong/How-to-make-high-resolution-remote-sensing-image-dataset->
上,欢迎关注!!!