Table of content (short-version) [paper]


Summary

  • 추가적인 보조기법(pose, parsing) 없이 다양한 discriminative visual cue를 확보하기 위한 방법
    • 기존의 CAM 방식은 가장 activated 되는 영역만 보여준다.
    • 하지만 overlapped activation panalty를 통해 학습시 덜 activate 된 부분까지 집중할 수 있다(몸 전체 영역을 고르게 분석할 수 있다).
    • Multi-branch 구조를 통해 각각 다른 영역을 고려
    • 이를 통해 테스트할 때 보다 여러개의 단서를 가지고 매칭할 수 있다.
  • 새로운 visualization 기법인 ranking activation map을 제안
    • 테스트에서 query와 gallery 사이의 관련된 시각적 특징을 바로 해석 가능
    • REID분야에서 query-gallery ranking 결과 해석 가능


[RAM 컨셉]

picture

  • 전체 프레임워크
    • ResNet50 backbone(conv4까지) 이후에 conv5부터 3개의 branch 존재
    • 각 branch별로 GAP + softmax를 통해 class score 추정
    • 각 branch별로 CAM 적용
    • Overlapped Activation Penalty (OAP)를 통해 CAM에 의해 activate 되는 결과 달라지도록 학습
    • OAP와 CE loss의 균형을 통해 학습
    • Ranking Activation Map (RAM)를 통해 결과확인


[전체 프레임워크]

picture


[Ranking Activation Map(RAM)]

picture


[Branch별 RAM 결과와 aggregated 결과]

picture


References

[1] Yang, Wenjie, et al. “Towards Rich Feature Discovery with Class Activation Maps Augmentation for Person Re-Identification.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019.