[논문 리뷰] Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving (2019)
·
Paper review/3D Object detection
나의 정리 논문이 지적한 문제점 기존의 monocular 3D detection의 경우 많은 논문들이 depth 정보를 만들어내 detection을 진행하는데 이 때 부정확한 depth 정보를 만들어 내기 때문에 LiDAR detector에 비해 낮은 성능을 내고 있다고 주장합니다. 하지만 이 논문은 부정확한 depth 정보가 성능 차이를 내는 것이 아니라고 주장합니다. 해결 방안 부정확한 depth 정보가 아닌 3D object detection에 더 어울리는 representation은 point cloud이기 때문에 LiDAR detector보다 낮은 성능을 내는 것이라고 주장합니다. 따라서 이 논문은 image로 depth map을 생성한 뒤 estimated depth map을 통해 Pseudo..
[논문 리뷰] Probabilistic and Geometric Depth: Detecting Objects in Perspective (2021) (PGD)
·
Paper review/3D Object detection
나의 정리 논문이 지적한 문제점 지금까지 monocular 3D object detection은 하나의 instance를 분리시켜 단일 regression target으로 depth estimation을 하여 문제를 해결했습니다. 하지만 image에는 여러 instance들이 존재하고, instance들끼리는 서로 기하학적인 관계를 가지고 있습니다. 또한 본질적으로 ill-posed problem을 가지고 있기 때문에 단일 regression target으로 depth를 예측하면 성능이 떨어지는 문제를 가집니다. 해결 방안 한 image 내 instance끼리의 geometric relationship을 이용해서 depth를 propagation하여 분리된 instance가 아닌 서로의 depth가 영향..
[논문 리뷰] DETR3D: 3D Object Detection from Multi-view Images via 3D-to-2D Queries (2021)
·
Paper review/3D Object detection
나의 정리 논문이 지적한 문제점 기존의 monocular 3D object detection으로 multi-view camera 3D object detection을 진행하려면 각각의 view 각각 detection을 진행해야 했습니다. 또한 추가적인 depth estimation network를 사용하거나 bottom-up 방식을 사용하면 compounding error로 인해 전체적인 성능의 저하를 일으킵니다. 해결 방안 detection head layer에서 object query를 사용해 bbox의 center를 prediction하여 그 값으로 2D feature를 sampling 해서 object query에 정보를 추가해주고 multi-head attention을 통해서 2D informa..
[논문 리뷰] Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Drivin (2022)
·
Paper review/3D Object detection
나의 정리 논문이 지적한 문제점: 기존의 monocular 3D object detection을 위해서 Pseudo-LiDAR 방식을 사용하는 경우엔 image로 너무 다른 modality를 가지는 LiDAR data를 생성하는데 많은 오류가 생기고 그로 인하여 성능 저하를 겪게 됩니다. 해결 방안: 따라서 input image로 virtual right image를 생성하여 기존의 Stereo 3D object detector를 통과시켜 3D object detection을 진행합니다. 이때 image를 생성하는 방법을 image-level generation, feature-level generation, feature-clone 세 가지 방식으로 생성하고 각각의 방식의 결과와 효과를 분석한 결과 d..
[논문 리뷰] SECOND: Sparsely Embedded Convolutional Detection (2018)
·
Paper review/3D Object detection
나의 정리 논문이 지적한 문제점: 기존의 Voxel 기반의 3D object detection인 VoxelNet에서 sparse 한 data인 LiDAR data에 convolution을 적용하다 보니 계산량이 많아 느린 단점과 orientation의 예측 성능이 낮은 문제점이 존재합니다. 해결 방안: Sparse한 data의 특성에 맞춰서 기존의 dense convolution이 아닌 sparse convolution을 이용하고 fast rule generation을 통하여 더 빠른 학습과 추론이 가능하게 하였습니다. 또한 기존의 angle regression loss 문제점을 지적하고 novel angle regression loss와 direction classifier를 통하여 orientatio..
[논문 리뷰] BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers (2022)
·
Paper review/3D Object detection
나의 정리논문이 지적한 문제점: 2D image를 이용해 3D object detection을 하는데 여러 문제점들이 존재합니다. 움직이는 물체의 속도나 가려짐의 정도가 심한 물체들을 검출해내는데 문제가 발생합니다. 또한 한 가지 camera view가 아닌 multi-camera view를 사용하는 경우엔 input이 커지게 되어 계산량이 복잡해질 수 있다는 문제가 있습니다. 이런 여러 가지 문제를 해결하고자 자율 주행 perception task를 수행하기 위해 BEV feature를 2D image로 생성하여 해결하는 BEVFormer 논문입니다.해결 방안: 먼저 static image가 아닌 video를 입력으로 받아서 temporal self-attention을 진행합니다. 이 TSA를 통해서 ..
[논문 리뷰] FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection (2021)
·
Paper review/3D Object detection
나의 정리 논문이 지적한 문제점: Fully convolution single-stage 구조를 가진 FCOS는 2D object detection을 진행하는데 이를 통하여 더 어려운 문제인 3D object detection을 진행하고자 한다. 해결 방안: 기존 FCOS에서 사용하던 regression target을 3D target으로 재구성하고 추가적인 disentangled head를 통해 얻은 component를 이용해서 3D bbox를 regression 한다. 또한 기존의 center-ness를 3D-center를 기반으로 gaussian distribution을 추가한 center-ness를 사용하여서 2D detector의 구조로 3D object detection을 진행할 수 있게 한다..
[논문 리뷰] FCOS: Fully Convolutional One-Stage Object Detection (2019)
·
Paper review/2D Object detection
나의 정리 논문이 지적한 문제점: 기존의 anchor 기반의 detector들은 사전 정의된 anchor를 사용하므로 섬세하고 많은 parameter tuning이 있어야 하고 계산량이 많이 들어가게 된다. 또한 Fully convolution이 아니기 때문에 다양하게 활용할 수 없다. 해결 방안: anchor-free 모델을 고안하였다. 이를 통해 계산량을 줄였고 design을 좀 더 간단하게 할 수 있게 하였다. 또한 x, y가 object의 bbox 안에만 있고 class가 같다면 positive sample로 사용하여서 기존의 anchor 기반의 모델들보다 더 많은 양의 positive sample을 사용하는 장점을 통해 성능 개선을 하였다. 두 객체가 겹쳐져 있어서 어떤 객체로 regressio..