1. MSTAR数据集扩充

  • 在原始SAR图像(128×128)中随机裁剪88×88大小的切片,每一张切片都能包含目标区域,经过随机采样样本数量可达(128-88+1)×(128-88+1)=1681 倍,每一个类别的每张SAR图像都采样10个切片,从而提高训练样本数量。

2. 全卷积网络模型(AConvNets)

  • 网络完全由卷积层实现,去掉全连接层,最后一层卷积输出直接Softmax输出每个类别概率,损失函数依旧为分类交叉熵损失,具体网络模型如下:

    image-20210809102008276

  • 其中卷积层使用BN层防止过拟合并加速训练,输入训练集维度:[b, 88, 88, 1] -> 输出:[b, 1, 1, 10],训练仍然采用的分类交叉熵损失,优化器Adam,学习率为0.0001。

3. SOC条件下分类结果

  • 训练集和测试集如下:
类别 数量
训练集17° 测试集15°
2S1 299 274
BMP2 233 196
BRDM2 298 274
BTR60 256 195
BTR70 233 196
D7 299 274
T62 299 273
T72 232 196
ZIL131 299 274
ZSU23/4 299 274
总计 2747 2426
  • 训练集每张SAR图像裁剪5个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共2747×6=16482 (张)。测试集中心裁剪88×88的切片。

  • 训练:epoch = 50, Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:

    image-20210809103258789image-20210809103401264

  • 计算测试集的混淆矩阵如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
     	 2S1 BMP2 BRDM B60 B70 D7 T62 T72 ZIL ZSU	
    2S1[[263 0 0 0 0 0 11 0 0 0] 95.99%
    BMP2[ 0 132 0 18 3 0 0 42 0 1] 67.35%
    BRDM[ 0 0 272 0 0 0 0 0 0 2] 99.27%
    B60 [ 0 0 0 192 0 0 0 0 1 2] 98.46%
    B70 [ 0 0 0 13 181 0 0 2 0 0] 92.35%
    D7 [ 2 0 0 0 0 272 0 0 0 0] 99.27%
    T62 [ 0 0 0 0 0 0 273 0 0 0] 100%
    T72 [ 0 0 0 1 0 0 0 195 0 0] 99.49%
    ZIL [ 0 0 0 0 0 4 0 0 270 0] 98.54%
    ZSU [ 0 0 0 0 0 0 0 0 0 274]] 100%
    总计: 95.07%
    The Precision is : 0.9574354589252246
    The Recall is : 0.9507109053615832
    The Accuracy is : 0.9579554822753503
    The F1 is : 0.9493873742571258
    The F_beta is : 0.949223632328047
    The Auc Score is : 0.9996171502953114

4. EOC1条件下分类结果

  • EOC1是大俯仰角变化条件下,其训练集和测试集如下:
类别 数量 数量
训练集17° 测试集30°
2S1 299 288
BRDM2 298 287
T72 299 288
ZSU234 299 288
总计 1195 1151
  • 训练集每张SAR图像裁剪5个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共1195×6=7170 (张)。测试集中心裁剪88×88的切片。

  • 训练:epoch200,Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:

    image-20210809120835524image-20210809120907698

  • 计算测试集的混淆矩阵如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
         2S1  BRDM  T72  ZSU	
    2S1 288 0 0 0 100%
    BRDM 0 287 0 0 100%
    T72 0 0 287 1 99.65%
    ZSU 59 0 0 229 79.51%
    总计: 94.79%

    The CNN Precision is : 0.9564058388673098
    The CNN Recall is : 0.9479166666666666
    The CNN Accuracy is : 0.947871416159861
    The CNN F1 is : 0.9473793419770824
    The CNN F_beta is : 0.9465925313694183

5. EOC2条件下分类结果

  • EOC2是车辆外观配置变化,其训练集如下:
类别 数量(俯仰角17°)
BMP2(9563) 233
BRDM2 298
BTR70(C71) 233
T72(132) 232
总计 995
  • 测试集:
类别 型号 数量(俯仰角17° & 15°)
T72 S7 419
T72 A32 572
T72 A62 573
T72 A63 573
T72 A64 573
总计 2710
  • 训练集每张SAR图像裁剪10个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共995×11=10945(张)。测试集中心裁剪88×88的切片。

  • 训练:epoch50,Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:

    image-20210809121909757image-20210809121932135

  • 计算测试集的混淆矩阵如下:

    1
    2
    3
    4
    5
    6
    7
    	BMP2  BRDM2  BTR70   T72  
    S7 8 0 0 411 98.09%
    A32 0 0 0 572 100%
    A62 1 0 0 572 99.83%
    A63 1 0 0 572 99.83%
    A64 4 0 0 569 96.14%
    总计:98.78%

6. EOC3条件下分类结果

  • EOC3是针对同一目标的不同型号变种,训练集和EOC2训练集一致,测试集如下:
类别 型号 数量(俯仰角17° & 15°)
BMP2 9566 428
BMP2 C21 429
T72 812 426
T72 A04 573
T72 A05 573
T72 A07 573
T72 A10 567
总计 3569
  • 这里直接用EOC2训练好的模型进行预测,测试集的混淆矩阵如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    		   BMP2   BRDM2    BTR70   T72  
    BMP9566 359 0 17 52 83.88%
    BMPC21 372 0 1 2 86.71%
    T72_812 2 0 1 423 99.30%
    T72_A04 3 0 0 570 99.48%
    T72_A05 1 0 0 572 99.83%
    T72_A07 0 0 0 573 100%
    T72_A10 20 0 0 547 96.47%
    总计:95.74%