Trong khoa học và kỹ thuật, phân tích dữ liệu hiện đại đối mặt với nhiều thách thức trong các ứng dụng thực tế. Một là kết hợp dữ liệu (data fusion). Trong nhiều hệ thống thực, các quyết định cần được đưa ra trong thời gian thực hoặc nhanh nhất có thể, cùng với xử lý song song các luồng dữ liệu, mà có thể còn được sinh ra từ nhiều nguồn khác nhau nhưng có những tính chất ẩn chung. Hai là nhiễu đột biến (impulsive noise) và ngoại lai (outliers). Giả định nhiễu đột biến ngày càng phổ biến, phù hợp nhiều ứng dụng thực tế. Nhiều loại dữ liệu được tạo ra bị mất mát hoặc có ngoại lai. Ba là biểu diễn dữ liệu đa chiều. Dữ liệu ten-xơ biểu diễn toàn diện nhưng độ phức tạp tính toán lớn. Kỹ thuật phân tích thành phần chính (PCA), trích xuất các không gian con có chiều thấp.
Một nhánh quan trọng của PCA là bám không gian con. PCA rất nhạy với các ngoại lai. PCA cho nhiễu đột biến hay ngoại lai gọi là PCA trơ, hiện thu hút nhiều quan tâm. PCA trơ và cho dữ liệu luồng gọi là bám không gian con trơ, khó hơn nhiều so với bám không gian con truyền thống. Đề tài nhằm phát triển phương pháp và thuật toán hiệu quả cho kết hợp dữ liệu dựa trên bám không gian con trơ cho luồng dữ liệu đa chiều từ một vài nguồn tương thông ảnh hưởng bởi nhiễu đột biến và ngoại lai.
Chúng tôi nghiên cứu bám không gian con trơ có cấu trúc và kết hợp với kỹ thuật trơ để xử lý nhiễu đột biến và ngoại lai. Kết quả nghiên cứu lý thuyết được áp dụng trong một vài ứng dụng trong xử lý tín hiệu y sinh và truyền thông.
Other information
Co-PI: Dr. Nguyen Viet Dung, Group leader, AVITECH