Recap Seminar – Framework cho hệ thống xử lý video trên nền tảng dữ liệu lớn

Seminar trình bày framework tổng quát cho hệ thống xử lý và phân tích video trên nền tảng dữ liệu lớn, minh họa thông qua bài báo “MTikGuard System: A Transformer-Based Multimodal System for Child-Safe Content Moderation on TikTok”, được báo cáo tại hội nghị PACLIC 2025.

Bài báo đề xuất một hệ thống phát hiện nội dung độc hại trong video TikTok nhằm bảo vệ trẻ em. Hệ thống sử dụng phương pháp multimodal learning, kết hợp thông tin từ ba nguồn: hình ảnh (frame video), âm thanh (speech-to-text) và văn bản xuất hiện trong video (OCR). Các đặc trưng này được xử lý bằng các mô hình Transformer như TimeSFormer cho video và DistilBERT/ViSoBERT cho văn bản, sau đó được kết hợp để thực hiện phân loại nội dung video.

Về kiến trúc hệ thống, pipeline xử lý được xây dựng trên các công nghệ dữ liệu lớn như Apache Kafka, Apache Spark, Airflow và Docker. Video được thu thập từ TikTok, xử lý qua pipeline streaming, trích xuất đặc trưng đa phương thức và đưa vào mô hình học sâu để phân loại. Kết quả thực nghiệm cho thấy hệ thống đạt 89.37% accuracy và 89.45% F1-score trên bộ dữ liệu TikHarm mở rộng.

Framework_cho_xử_lý_video_trực_tuyến_trên_nền_tảng_dữ_liệu_lớn.jpg

Framework_cho_xử_lý_video_trực_tuyến_trên_nền_tảng_dữ_liệu_lớn.png

Seminar cho thấy việc kết hợp hệ thống xử lý dữ liệu lớn với các mô hình AI đa phương thức là hướng tiếp cận hiệu quả để xây dựng các hệ thống phân tích video quy mô lớn trong thực tế.

Khoa Công nghệ Phần mềm trân trọng cảm ơn Ts. Đỗ Trọng Hợp vì phần trình bày sâu sắc và truyền cảm hứng, đồng thời gửi lời cảm ơn đến toàn thể quý thầy cô đã tham dự, góp phần tạo nên sự thành công của chương trình.

z7612221677490 44c5512451ae6bc01289bff2dd1f9541

z7612225742552 8b52c7623c4d3830bb3c052579c89cdb