Nhằm trao đổi và nâng cao chuyên môn, vào sáng ngày 19/03/2024, Khoa Công nghệ Phần mềm đã tổ chức buổi seminar học thuật tại phòng E7.3 với chủ đề "ANALYSIS OF FINE-GRAINED COUNTING METHODS FOR MASKED FACE COUNTING: A COMPARATIVE STUDY” với sự tham gia của các Thầy Cô, Giảng viên trong Khoa, dưới sự trình bày TS. Nguyễn Duy Khánh đã diễn ra thành công tốt đẹp.
Buổi seminar trình bày về việc bài toán đếm số lượng khuôn mặt đeo khẩu trang trong ảnh là việc đếm số lượng khuôn mặt dưới các mật độ đám đông khác nhau và phân biệt giữa khuôn mặt đeo khẩu trang và khuôn mặt không đeo khẩu trang, điều này thường được coi là một nhiệm vụ phát hiện đối tượng (tức là khuôn mặt). Độ chính xác của việc đếm bị hạn chế, đặc biệt là ở mật độ đám đông cao, khi các khuôn mặt tương đối nhỏ, không rõ ràng và được quan sát ở các góc độ khác nhau. Hơn nữa, việc gán nhãn các khung bao cần thiết để huấn luyện các phương pháp phát hiện đối tượng là tốn kém. Chúng tôi xem xét việc đếm khuôn mặt đeo khẩu trang như một nhiệm vụ đếm đám đông chi tiết (fine-grained crowd counting), điều này là phù hợp để giải quyết các thách thức nêu trên với việc hồi quy bản đồ mật độ. Tuy nhiên, việc áp dụng các phương pháp đếm đám đông chi tiết cho việc đếm khuôn mặt đeo khẩu trang không phải là điều dễ dàng. Cần phải xác định các chiến lược phù hợp cho cả việc đếm và phân loại đa lớp. Chúng tôi đã so sánh các chiến lược của các phương pháp khác nhau và xem xét các ưu điểm và nhược điểm của chúng. Các chiến lược này bao gồm (1) hồi quy đơn giản và hồi quy kết hợp với phát hiện để đếm, (2) sử dụng bản đồ mật độ nhận biết lớp (class-aware density maps) với bản đồ phân đoạn ngữ nghĩa (semantic segmentation maps) và xác suất lớp cho việc phân loại, và (3) đếm sử dung/không sử dụng thông tin độ sâu (depth information). Phân tích của bảy phương pháp đếm đám đông trên ba bộ dữ liệu với tổng cộng khoảng 900 nghìn chú thích đã chứng minh rằng mức độ đông đúc ảnh hưởng đến mức độ chính xác của hồi quy đơn giản và hồi quy kết hợp với phát hiện cho việc đếm. Trong khi đó, phương pháp hiệu quả nhất cho việc phân loại là sử dụng bản đồ phân đoạn ngữ nghĩa. Đánh giá về tính hữu ích của việc sử dụng dữ liệu độ sâu đã chứng minh nhu cầu về một bản đồ độ sâu để đạt được độ chính xác cao khi đếm. Các phát hiện này của chúng tôi sẽ hữu ích cho các nghiên cứu trong tương lai.
Dưới đây là một số tóm tắt về kết quả và Thầy Cô tham dự.