- Banner được lưu thành công.
Bài báo: "PHÁT HIỆN ĐỐI TƯỢNG TRONG KHÔNG ẢNH SỬ DỤNG PHƯƠNG PHÁP DINO"
Sinh viên thực hiện:
• Lê Hữu Độ- KTPM2022.1- Tác giả chính
• Ngô Hương Giang- KTPM2022.1- Đồng tác giả
Giảng viên hướng dẫn:
• ThS. Võ Duy Nguyên
• ThS. Trần Thị Hồng Yến
• ThS. Nguyễn Thành Hiệp
Tóm tắt bài báo:
Trong thời gian gần đây, việc thu thập dữ liệu từ các thiết bị bay không người lái đã làm tăng sự phát triển đáng kể của các tác vụ liên quan đến xử lý ảnh chụp từ trên không. Ba tác vụ cơ bản trong lĩnh vực này bao gồm phân lớp, phát hiện đối tượng và phân đoạn. Tuy nhiên, nói riêng về nhiệm vụ phát hiện đối tượng, các nhà nghiên cứu thường tập trung vào việc cải tiến các mô hình truyền thống, tức các mô hình thuộc loại một giai đoạn hoặc hai giai đoạn. Song, chúng ta cũng chứng kiến sự xuất hiện và phát triển đáng chú ý của các mô hình phát hiện đối tượng end-to-end. Trong số các phương pháp này, nổi bật có DINO (DETR withImproved deNoising anchor boxes), một phương pháp end-to-end đầu tiên đạt kết quả SOTA trên bảng xếp hạng. Chúng tôi đã tiến hành các thực nghiệm trên bộ dữ liệu không ảnh VisDrone với nhiều backbone khác nhau để đánh giá toàn diện hiệu suất của phương pháp DINO và thu được nhiều kết quả đáng chú ý. Đây là một kết quả cạnh tranh đầy hứa hẹn cho những phương pháp end-to-end khác.
"Chúng em xin chân thành gửi lời cảm ơn đến Khoa Công nghệ Phần mềm, PTN Truyền thông Đa phương tiện và nhóm nghiên cứu UIT-Together đã tạo điều kiện giúp chúng em có thể nghiên cứu và hoàn thành bài báo này."
---------------------------------------
Hội nghị Quốc gia về Điện tử, Truyền thông và Công nghệ Thông tin lần thứ XXVI, REV-ECIT 2023 (The 26nd National Conference on Electronics, Communications and Information Technology), viết tắt là REV-ECIT, Thời gian tổ chức: 16/12/2023
Nguồn: Trường Đại học Công nghệ Thông tin
- Banner được lưu thành công.
Bài báo: "𝗔𝗲𝗿𝗶𝗮𝗹 𝗗𝗮𝘁𝗮 𝗘𝘅𝗽𝗹𝗼𝗿𝗮𝘁𝗶𝗼𝗻: 𝗔𝗻 𝗜𝗻-𝗗𝗲𝗽𝘁𝗵 𝗦𝘁𝘂𝗱𝘆 𝗳𝗿𝗼𝗺 𝗛𝗼𝗿𝗶𝘇𝗼𝗻𝘁𝗮𝗹 𝘁𝗼 𝗢𝗿𝗶𝗲𝗻𝘁𝗲𝗱 𝗩𝗶𝗲𝘄𝗽𝗼𝗶𝗻𝘁"
Link bài báo: https://ieeexplore.ieee.org/document/10453557/
Sinh viên thực hiện:
• Ngô Hương Giang - KTPM2022.1 - Đồng tác giả
• Toàn Lê - KTPM2022.3 - Đồng tác giả
• Nguyễn Xuân Quang- KTPM2022.3- Đồng tác giả
• Đoàn Danh Dự- KTPM2022.1- Đồng tác giả
• Nguyễn Vũ Bình- KTPM2022.1- Đồng tác giả
• Lê Hữu Độ- KTOM2022.1- Đồng tác giả
• Lê Duy Nguyên- KTPM2022.2- Đồng tác giả
• Trần Nguyễn Chí Huy- KTPM2022.1- Đồng tác giả
Người hướng dẫn:
• ThS. Võ Duy Nguyên
• TS. Nguyễn Duy Khánh
• TS. Nguyễn Tấn Trần Minh Khang
Tóm tắt bài báo:
- Bảng tiếng Anh
The development of technological devices, such as satellites and drones, has made it easier to collect images and videos from the air. From these vast data sources, the problem of detecting objects in aerial images is formed to serve situations: rescue missions, social scenarios, security needs, and more. This issue attracts a lot of attention from researchers in computer vision because of its high applicability in real life. However, this problem faces many significant challenges due to the complex factors of environments. To overcome these difficulties, many studies focus on developing effective models for detecting and tracking objects from UAV systems. In this paper, our primary emphasis is comprehensive survey of methodologies pertaining to horizontal and oriented object detection. After researching many practical and innovative techniques in different approaches, we have carefully selected 15 methods for horizontal object detection and 18 for oriented object detection that were recently researched and developed to conduct classifications, surveys and assessments. We also provide a taxonomy mind map to assist readers in gaining an overview of the methods we surveyed. Additional, we examine 17 aerial image datasets collected from platforms and in various locations worldwide. These are typical datasets widely used to serve two primary tasks: horizontal object detection and oriented object detection. Then, we compared the experimental resultsof the previously introduced methods on four typical datasets: VisDrone, UAVDT, DOTAv1.0, and HRSC2016. The above datasets present diversity in the number of classes and the complexity of real-life conditions. Furthermore, they have been tested with various methods and shown remarkable results. For the reasons mentioned, we believe that updating and synthesizing the latest research will provide complete and comprehensive information, helping researchers to have more survey material for the development of the field of object detection in the future.
- Bảng tiếng Anh
Sự phát triển của các thiết bị công nghệ, như vệ tinh và máy bay không người lái, đã giúp việc thu thập hình ảnh và video từ trên không trở nên dễ dàng hơn. Từ những nguồn dữ liệu khổng lồ này, bài toán phát hiện vật thể trong ảnh chụp từ trên không được hình thành để phục vụ các tình huống: nhiệm vụ cứu hộ, kịch bản xã hội, nhu cầu an ninh, v.v. Vấn đề này thu hút rất nhiều sự quan tâm của các nhà nghiên cứu về thị giác máy tính vì tính ứng dụng cao trong đời sống. Tuy nhiên, vấn đề này phải đối mặt với nhiều thách thức đáng kể do các yếu tố phức tạp của môi trường. Để khắc phục những khó khăn này, nhiều nghiên cứu tập trung phát triển các mô hình hiệu quả để phát hiện và theo dõi vật thể từ hệ thống UAV. Trong bài viết này, trọng tâm chính của chúng tôi là khảo sát toàn diện các phương pháp liên quan đến phát hiện đối tượng theo chiều ngang và định hướng. Sau khi nghiên cứu nhiều kỹ thuật thực tế và sáng tạo theo nhiều cách tiếp cận khác nhau, chúng tôi đã lựa chọn cẩn thận 15 phương pháp phát hiện vật thể nằm ngang và 18 phương pháp phát hiện vật thể định hướng được nghiên cứu và phát triển gần đây để tiến hành phân loại, khảo sát và đánh giá. Chúng tôi cũng cung cấp bản đồ tư duy phân loại để hỗ trợ người đọc có được cái nhìn tổng quan về các phương pháp chúng tôi đã khảo sát. Ngoài ra, chúng tôi kiểm tra 17 bộ dữ liệu hình ảnh trên không được thu thập từ các nền tảng và ở nhiều địa điểm khác nhau trên toàn thế giới. Đây là những bộ dữ liệu điển hình được sử dụng rộng rãi để phục vụ hai nhiệm vụ chính: phát hiện đối tượng ngang và phát hiện đối tượng định hướng. Sau đó, chúng tôi so sánh kết quả thử nghiệm của các phương pháp được giới thiệu trước đó trên bốn bộ dữ liệu điển hình: VisDrone, UAVDT, DOTAv1.0 và HRSC2016. Các bộ dữ liệu trên thể hiện sự đa dạng về số lượng lớp và độ phức tạp của điều kiện thực tế. Hơn nữa, chúng đã được thử nghiệm bằng nhiều phương pháp khác nhau và cho thấy kết quả đáng chú ý. Vì những lý do nêu trên, chúng tôi tin rằng việc cập nhật, tổng hợp các nghiên cứu mới nhất sẽ cung cấp thông tin đầy đủ và toàn diện, giúp các nhà nghiên cứu có thêm tài liệu khảo sát phục vụ phát triển lĩnh vực phát hiện vật thể trong tương lai.
"Chúng em xin chân thành gửi lời cảm ơn đến Khoa Công nghệ Phần mềm, PTN Truyền thông Đa phương tiện và nhóm nghiên cứu UIT-Together đã tạo điều kiện giúp chúng em có thể nghiên cứu và hoàn thành bài báo này."
---------------------------------------
IEEE Access là một tạp chí khoa học bình duyệt truy cập mở được xuất bản bởi Viện Kỹ sư Điện và Điện tử, được thành lập vào năm 2013. Tổng biên tập sáng lập là Michael Pecht và tổng biên tập hiện tại là Derek Abbott. Tạp chí đã giành được một Giải thưởng PROSE vào năm 2015 cho tạp chí mới hay nhất trong khoa học, công nghệ, kỹ thuật và toán học. Tạp chí IEEE Access thuộc xếp hạng cao nhất SCIE-Q1.
- Banner được lưu thành công.
Nhằm trao đổi và nâng cao chuyên môn, vào sáng ngày 19/03/2024, Khoa Công nghệ Phần mềm đã tổ chức buổi seminar học thuật tại phòng E7.3 với chủ đề "ANALYSIS OF FINE-GRAINED COUNTING METHODS FOR MASKED FACE COUNTING: A COMPARATIVE STUDY” với sự tham gia của các Thầy Cô, Giảng viên trong Khoa, dưới sự trình bày TS. Nguyễn Duy Khánh đã diễn ra thành công tốt đẹp.
Buổi seminar trình bày về việc bài toán đếm số lượng khuôn mặt đeo khẩu trang trong ảnh là việc đếm số lượng khuôn mặt dưới các mật độ đám đông khác nhau và phân biệt giữa khuôn mặt đeo khẩu trang và khuôn mặt không đeo khẩu trang, điều này thường được coi là một nhiệm vụ phát hiện đối tượng (tức là khuôn mặt). Độ chính xác của việc đếm bị hạn chế, đặc biệt là ở mật độ đám đông cao, khi các khuôn mặt tương đối nhỏ, không rõ ràng và được quan sát ở các góc độ khác nhau. Hơn nữa, việc gán nhãn các khung bao cần thiết để huấn luyện các phương pháp phát hiện đối tượng là tốn kém. Chúng tôi xem xét việc đếm khuôn mặt đeo khẩu trang như một nhiệm vụ đếm đám đông chi tiết (fine-grained crowd counting), điều này là phù hợp để giải quyết các thách thức nêu trên với việc hồi quy bản đồ mật độ. Tuy nhiên, việc áp dụng các phương pháp đếm đám đông chi tiết cho việc đếm khuôn mặt đeo khẩu trang không phải là điều dễ dàng. Cần phải xác định các chiến lược phù hợp cho cả việc đếm và phân loại đa lớp. Chúng tôi đã so sánh các chiến lược của các phương pháp khác nhau và xem xét các ưu điểm và nhược điểm của chúng. Các chiến lược này bao gồm (1) hồi quy đơn giản và hồi quy kết hợp với phát hiện để đếm, (2) sử dụng bản đồ mật độ nhận biết lớp (class-aware density maps) với bản đồ phân đoạn ngữ nghĩa (semantic segmentation maps) và xác suất lớp cho việc phân loại, và (3) đếm sử dung/không sử dụng thông tin độ sâu (depth information). Phân tích của bảy phương pháp đếm đám đông trên ba bộ dữ liệu với tổng cộng khoảng 900 nghìn chú thích đã chứng minh rằng mức độ đông đúc ảnh hưởng đến mức độ chính xác của hồi quy đơn giản và hồi quy kết hợp với phát hiện cho việc đếm. Trong khi đó, phương pháp hiệu quả nhất cho việc phân loại là sử dụng bản đồ phân đoạn ngữ nghĩa. Đánh giá về tính hữu ích của việc sử dụng dữ liệu độ sâu đã chứng minh nhu cầu về một bản đồ độ sâu để đạt được độ chính xác cao khi đếm. Các phát hiện này của chúng tôi sẽ hữu ích cho các nghiên cứu trong tương lai.
Dưới đây là một số tóm tắt về kết quả và Thầy Cô tham dự.

- Banner được lưu thành công.
Nhằm đẩy mạnh phong trào nghiên cứu khoa học trong sinh viên/ học viên cao học, kích thích sự say mê tìm tòi học hỏi của sinh viên; Phòng ĐTSĐH&KHCN thông báo đến toàn thể các sinh viên/ học viên cao học và giảng viên hướng dẫn về đăng ký đề tài nghiên cứu khoa học sinh viên/ học viên cao học năm 2024 như sau:
+ Kinh phí thực hiện: 6.000.000 đồng/đề tài.
+ Điều kiện tham gia: Sinh viên hoặc học viên cao học (không quá 02 thành viên tham gia/đề tài).
+ Thời gian thực hiện đề tài: 06 tháng kể từ khi được ký hợp đồng.
+ Hạn chót sinh viên/ học viên cao học đăng ký đề tài qua mạng:
-
- Đợt 1: ngày 15/4/2024
- Đợt 2: ngày 15/8/2024
- Đợt 3: ngày 15/11/2024
Link đăng ký: https://bit.ly/2ImBA2K (Phòng ĐTSĐH&KHCN sẽ mở form đăng ký trước 1 tuần deadline).
Link thông báo của Phòng:https://link.uit.edu.vn/obJeJ
Sinh viên quan tâm vui lòng chuẩn bị trước file thuyết minh đề tài NCKHSV
- Banner được lưu thành công.
Bài báo: "PHÁT HIỆN TÀU THUYỀN TRONG KHÔNG ẢNH BẰNG PHƯƠNG PHÁP RTMDET- ROTATED"
Link bài báo: tại đây
Sinh viên thực hiện
Trần Nguyễn Chí Huy- KTPM2022.1
Người hướng dẫn:
- ThS. Võ Duy Nguyên
- ThS. Đinh Nguyễn Anh Dũng
Tóm tắt bài báo:
Hiện nay, nhờ vào sự phát triển của các thiết bị bay không người lái, phát hiện đối tượng trong ảnh được chụp từ trên cao đang trở thành một đề tài nổi bật trong lĩnh vực thị giác máy tính. Tuy nhiên, các phương pháp phát hiện đối tượng truyền thống vẫn chưa thể hiện được hướng của vật thể và các hộp giới hạn bị chồng lấp nhau nếu ảnh có mật độ đối tượng dày đặc. Vì thế, bài toán phát hiện đối tượng xoay được hình thành. Trong đó, phát hiện tàu thuyền là một trong những vấn đề đang thu hút được nhiều sự quan tâm bởi tính ứng dụng cao trong thực tế, đặc biệt khi tình hình chủ quyền lãnh hải, an toàn biển đảo Quốc gia đang có nhiều thách thức, biến động. Nhằm khắc phục những khó khăn và đáp ứng nhu cầu trên, nhiều nghiên cứu đã tập trung vào phát triển các phương pháp hiệu quả. Trong nghiên cứu này, chúng tôi tiến hành đánh giá thực nghiệm mô hình phát hiện đối tượng theo thời gian thực, được gọi là RTMDet (Real-Time Models for object Detection), với hai backbone CSPNeXt và CSPDarkNet trên bộ dữ liệu DOTA-ship. Bộ dữ liệu này đã được tạo ra nhằm đáp ứng nhu cầu đặc biệt của các ứng dụng liên quan đến phát hiện tàu thuyền. DOTA-ship cũng tái hiện hầu hết thách thức trong các tình huống ngoài đời thực. Cuối cùng, chúng tôi khảo sát kết quả và đưa ra những nhận xét, phân tích chi tiết về RTMDet khi huấn luyện trên bộ dữ liệu DOTA-ship, từ đó gợi ra những hướng phát triển nghiên cứu tiếp theo để cải tiến phương pháp trong tương lai.
"Em xin chân thành gửi lời cảm ơn đến Khoa Công nghệ Phần mềm, PTN Truyền thông Đa phương tiện và nhóm nghiên cứu UIT-Together đã tạo điều kiện giúp em có thể nghiên cứu và hoàn thành bài báo này."
---------------------------------------
Hội nghị Quốc gia về Điện tử, Truyền thông và Công nghệ Thông tin lần thứ XXVI, REV-ECIT 2023 (The 26nd National Conference on Electronics, Communications and Information Technology), viết tắt là REV-ECIT, Thời gian tổ chức: 16/12/2023
Nguồn: Trường đại học Công nghệ Thông tin