Bài báo: "𝗔𝗲𝗿𝗶𝗮𝗹 𝗗𝗮𝘁𝗮 𝗘𝘅𝗽𝗹𝗼𝗿𝗮𝘁𝗶𝗼𝗻: 𝗔𝗻 𝗜𝗻-𝗗𝗲𝗽𝘁𝗵 𝗦𝘁𝘂𝗱𝘆 𝗳𝗿𝗼𝗺 𝗛𝗼𝗿𝗶𝘇𝗼𝗻𝘁𝗮𝗹 𝘁𝗼 𝗢𝗿𝗶𝗲𝗻𝘁𝗲𝗱 𝗩𝗶𝗲𝘄𝗽𝗼𝗶𝗻𝘁"
Link bài báo: https://ieeexplore.ieee.org/document/10453557/
Sinh viên thực hiện:
• Ngô Hương Giang - KTPM2022.1 - Đồng tác giả
• Toàn Lê - KTPM2022.3 - Đồng tác giả
• Nguyễn Xuân Quang- KTPM2022.3- Đồng tác giả
• Đoàn Danh Dự- KTPM2022.1- Đồng tác giả
• Nguyễn Vũ Bình- KTPM2022.1- Đồng tác giả
• Lê Hữu Độ- KTOM2022.1- Đồng tác giả
• Lê Duy Nguyên- KTPM2022.2- Đồng tác giả
• Trần Nguyễn Chí Huy- KTPM2022.1- Đồng tác giả
Người hướng dẫn:
• ThS. Võ Duy Nguyên
• TS. Nguyễn Duy Khánh
• TS. Nguyễn Tấn Trần Minh Khang
Tóm tắt bài báo:
- Bảng tiếng Anh
The development of technological devices, such as satellites and drones, has made it easier to collect images and videos from the air. From these vast data sources, the problem of detecting objects in aerial images is formed to serve situations: rescue missions, social scenarios, security needs, and more. This issue attracts a lot of attention from researchers in computer vision because of its high applicability in real life. However, this problem faces many significant challenges due to the complex factors of environments. To overcome these difficulties, many studies focus on developing effective models for detecting and tracking objects from UAV systems. In this paper, our primary emphasis is comprehensive survey of methodologies pertaining to horizontal and oriented object detection. After researching many practical and innovative techniques in different approaches, we have carefully selected 15 methods for horizontal object detection and 18 for oriented object detection that were recently researched and developed to conduct classifications, surveys and assessments. We also provide a taxonomy mind map to assist readers in gaining an overview of the methods we surveyed. Additional, we examine 17 aerial image datasets collected from platforms and in various locations worldwide. These are typical datasets widely used to serve two primary tasks: horizontal object detection and oriented object detection. Then, we compared the experimental resultsof the previously introduced methods on four typical datasets: VisDrone, UAVDT, DOTAv1.0, and HRSC2016. The above datasets present diversity in the number of classes and the complexity of real-life conditions. Furthermore, they have been tested with various methods and shown remarkable results. For the reasons mentioned, we believe that updating and synthesizing the latest research will provide complete and comprehensive information, helping researchers to have more survey material for the development of the field of object detection in the future.
- Bảng tiếng Anh
Sự phát triển của các thiết bị công nghệ, như vệ tinh và máy bay không người lái, đã giúp việc thu thập hình ảnh và video từ trên không trở nên dễ dàng hơn. Từ những nguồn dữ liệu khổng lồ này, bài toán phát hiện vật thể trong ảnh chụp từ trên không được hình thành để phục vụ các tình huống: nhiệm vụ cứu hộ, kịch bản xã hội, nhu cầu an ninh, v.v. Vấn đề này thu hút rất nhiều sự quan tâm của các nhà nghiên cứu về thị giác máy tính vì tính ứng dụng cao trong đời sống. Tuy nhiên, vấn đề này phải đối mặt với nhiều thách thức đáng kể do các yếu tố phức tạp của môi trường. Để khắc phục những khó khăn này, nhiều nghiên cứu tập trung phát triển các mô hình hiệu quả để phát hiện và theo dõi vật thể từ hệ thống UAV. Trong bài viết này, trọng tâm chính của chúng tôi là khảo sát toàn diện các phương pháp liên quan đến phát hiện đối tượng theo chiều ngang và định hướng. Sau khi nghiên cứu nhiều kỹ thuật thực tế và sáng tạo theo nhiều cách tiếp cận khác nhau, chúng tôi đã lựa chọn cẩn thận 15 phương pháp phát hiện vật thể nằm ngang và 18 phương pháp phát hiện vật thể định hướng được nghiên cứu và phát triển gần đây để tiến hành phân loại, khảo sát và đánh giá. Chúng tôi cũng cung cấp bản đồ tư duy phân loại để hỗ trợ người đọc có được cái nhìn tổng quan về các phương pháp chúng tôi đã khảo sát. Ngoài ra, chúng tôi kiểm tra 17 bộ dữ liệu hình ảnh trên không được thu thập từ các nền tảng và ở nhiều địa điểm khác nhau trên toàn thế giới. Đây là những bộ dữ liệu điển hình được sử dụng rộng rãi để phục vụ hai nhiệm vụ chính: phát hiện đối tượng ngang và phát hiện đối tượng định hướng. Sau đó, chúng tôi so sánh kết quả thử nghiệm của các phương pháp được giới thiệu trước đó trên bốn bộ dữ liệu điển hình: VisDrone, UAVDT, DOTAv1.0 và HRSC2016. Các bộ dữ liệu trên thể hiện sự đa dạng về số lượng lớp và độ phức tạp của điều kiện thực tế. Hơn nữa, chúng đã được thử nghiệm bằng nhiều phương pháp khác nhau và cho thấy kết quả đáng chú ý. Vì những lý do nêu trên, chúng tôi tin rằng việc cập nhật, tổng hợp các nghiên cứu mới nhất sẽ cung cấp thông tin đầy đủ và toàn diện, giúp các nhà nghiên cứu có thêm tài liệu khảo sát phục vụ phát triển lĩnh vực phát hiện vật thể trong tương lai.
"Chúng em xin chân thành gửi lời cảm ơn đến Khoa Công nghệ Phần mềm, PTN Truyền thông Đa phương tiện và nhóm nghiên cứu UIT-Together đã tạo điều kiện giúp chúng em có thể nghiên cứu và hoàn thành bài báo này."
---------------------------------------
IEEE Access là một tạp chí khoa học bình duyệt truy cập mở được xuất bản bởi Viện Kỹ sư Điện và Điện tử, được thành lập vào năm 2013. Tổng biên tập sáng lập là Michael Pecht và tổng biên tập hiện tại là Derek Abbott. Tạp chí đã giành được một Giải thưởng PROSE vào năm 2015 cho tạp chí mới hay nhất trong khoa học, công nghệ, kỹ thuật và toán học. Tạp chí IEEE Access thuộc xếp hạng cao nhất SCIE-Q1.