Recap Seminar – Framework cho hệ thống xử lý video trên nền tảng dữ liệu lớn
Seminar trình bày framework tổng quát cho hệ thống xử lý và phân tích video trên nền tảng dữ liệu lớn, minh họa thông qua bài báo “MTikGuard System: A Transformer-Based Multimodal System for Child-Safe Content Moderation on TikTok”, được báo cáo tại hội nghị PACLIC 2025.
Bài báo đề xuất một hệ thống phát hiện nội dung độc hại trong video TikTok nhằm bảo vệ trẻ em. Hệ thống sử dụng phương pháp multimodal learning, kết hợp thông tin từ ba nguồn: hình ảnh (frame video), âm thanh (speech-to-text) và văn bản xuất hiện trong video (OCR). Các đặc trưng này được xử lý bằng các mô hình Transformer như TimeSFormer cho video và DistilBERT/ViSoBERT cho văn bản, sau đó được kết hợp để thực hiện phân loại nội dung video.
Về kiến trúc hệ thống, pipeline xử lý được xây dựng trên các công nghệ dữ liệu lớn như Apache Kafka, Apache Spark, Airflow và Docker. Video được thu thập từ TikTok, xử lý qua pipeline streaming, trích xuất đặc trưng đa phương thức và đưa vào mô hình học sâu để phân loại. Kết quả thực nghiệm cho thấy hệ thống đạt 89.37% accuracy và 89.45% F1-score trên bộ dữ liệu TikHarm mở rộng.


Seminar cho thấy việc kết hợp hệ thống xử lý dữ liệu lớn với các mô hình AI đa phương thức là hướng tiếp cận hiệu quả để xây dựng các hệ thống phân tích video quy mô lớn trong thực tế.
Khoa Công nghệ Phần mềm trân trọng cảm ơn Ts. Đỗ Trọng Hợp vì phần trình bày sâu sắc và truyền cảm hứng, đồng thời gửi lời cảm ơn đến toàn thể quý thầy cô đã tham dự, góp phần tạo nên sự thành công của chương trình.


VI
EN