1. MSTAR数据集扩充
- 在原始SAR图像(128×128)中随机裁剪88×88大小的切片,每一张切片都能包含目标区域,经过随机采样样本数量可达(128-88+1)×(128-88+1)=1681 倍,每一个类别的每张SAR图像都采样10个切片,从而提高训练样本数量。
2. 全卷积网络模型(AConvNets)
网络完全由卷积层实现,去掉全连接层,最后一层卷积输出直接Softmax输出每个类别概率,损失函数依旧为分类交叉熵损失,具体网络模型如下:
其中卷积层使用BN层防止过拟合并加速训练,输入训练集维度:[b, 88, 88, 1] -> 输出:[b, 1, 1, 10],训练仍然采用的分类交叉熵损失,优化器Adam,学习率为0.0001。
3. SOC条件下分类结果
- 训练集和测试集如下:
类别 | 数量 | |
---|---|---|
训练集17° | 测试集15° | |
2S1 | 299 | 274 |
BMP2 | 233 | 196 |
BRDM2 | 298 | 274 |
BTR60 | 256 | 195 |
BTR70 | 233 | 196 |
D7 | 299 | 274 |
T62 | 299 | 273 |
T72 | 232 | 196 |
ZIL131 | 299 | 274 |
ZSU23/4 | 299 | 274 |
总计 | 2747 | 2426 |
训练集每张SAR图像裁剪5个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共2747×6=16482 (张)。测试集中心裁剪88×88的切片。
训练:epoch = 50, Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:
计算测试集的混淆矩阵如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
182S1 BMP2 BRDM B60 B70 D7 T62 T72 ZIL ZSU
2S1[[263 0 0 0 0 0 11 0 0 0] 95.99%
BMP2[ 0 132 0 18 3 0 0 42 0 1] 67.35%
BRDM[ 0 0 272 0 0 0 0 0 0 2] 99.27%
B60 [ 0 0 0 192 0 0 0 0 1 2] 98.46%
B70 [ 0 0 0 13 181 0 0 2 0 0] 92.35%
D7 [ 2 0 0 0 0 272 0 0 0 0] 99.27%
T62 [ 0 0 0 0 0 0 273 0 0 0] 100%
T72 [ 0 0 0 1 0 0 0 195 0 0] 99.49%
ZIL [ 0 0 0 0 0 4 0 0 270 0] 98.54%
ZSU [ 0 0 0 0 0 0 0 0 0 274]] 100%
总计: 95.07%
The Precision is : 0.9574354589252246
The Recall is : 0.9507109053615832
The Accuracy is : 0.9579554822753503
The F1 is : 0.9493873742571258
The F_beta is : 0.949223632328047
The Auc Score is : 0.9996171502953114
4. EOC1条件下分类结果
- EOC1是大俯仰角变化条件下,其训练集和测试集如下:
类别 | 数量 | 数量 |
---|---|---|
训练集17° | 测试集30° | |
2S1 | 299 | 288 |
BRDM2 | 298 | 287 |
T72 | 299 | 288 |
ZSU234 | 299 | 288 |
总计 | 1195 | 1151 |
训练集每张SAR图像裁剪5个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共1195×6=7170 (张)。测试集中心裁剪88×88的切片。
训练:epoch200,Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:
计算测试集的混淆矩阵如下:
1
2
3
4
5
6
7
8
9
10
11
122S1 BRDM T72 ZSU
2S1 288 0 0 0 100%
BRDM 0 287 0 0 100%
T72 0 0 287 1 99.65%
ZSU 59 0 0 229 79.51%
总计: 94.79%
The CNN Precision is : 0.9564058388673098
The CNN Recall is : 0.9479166666666666
The CNN Accuracy is : 0.947871416159861
The CNN F1 is : 0.9473793419770824
The CNN F_beta is : 0.9465925313694183
5. EOC2条件下分类结果
- EOC2是车辆外观配置变化,其训练集如下:
类别 | 数量(俯仰角17°) |
---|---|
BMP2(9563) | 233 |
BRDM2 | 298 |
BTR70(C71) | 233 |
T72(132) | 232 |
总计 | 995 |
- 测试集:
类别 | 型号 | 数量(俯仰角17° & 15°) |
---|---|---|
T72 | S7 | 419 |
T72 | A32 | 572 |
T72 | A62 | 573 |
T72 | A63 | 573 |
T72 | A64 | 573 |
总计 | 2710 |
训练集每张SAR图像裁剪10个随机切片,中心裁剪1个切片,均为88×88像素,训练集一共995×11=10945(张)。测试集中心裁剪88×88的切片。
训练:epoch50,Adam优化器,learning_rate = 0.0001, 在tensorboard中显示训练集和测试集Accuracy、Loss曲线:
计算测试集的混淆矩阵如下:
1
2
3
4
5
6
7BMP2 BRDM2 BTR70 T72
S7 8 0 0 411 98.09%
A32 0 0 0 572 100%
A62 1 0 0 572 99.83%
A63 1 0 0 572 99.83%
A64 4 0 0 569 96.14%
总计:98.78%
6. EOC3条件下分类结果
- EOC3是针对同一目标的不同型号变种,训练集和EOC2训练集一致,测试集如下:
类别 | 型号 | 数量(俯仰角17° & 15°) |
---|---|---|
BMP2 | 9566 | 428 |
BMP2 | C21 | 429 |
T72 | 812 | 426 |
T72 | A04 | 573 |
T72 | A05 | 573 |
T72 | A07 | 573 |
T72 | A10 | 567 |
总计 | 3569 |
这里直接用EOC2训练好的模型进行预测,测试集的混淆矩阵如下:
1
2
3
4
5
6
7
8
9BMP2 BRDM2 BTR70 T72
BMP9566 359 0 17 52 83.88%
BMPC21 372 0 1 2 86.71%
T72_812 2 0 1 423 99.30%
T72_A04 3 0 0 570 99.48%
T72_A05 1 0 0 572 99.83%
T72_A07 0 0 0 573 100%
T72_A10 20 0 0 547 96.47%
总计:95.74%