Ονοματεπώνυμο: Στυλιανίδης Ιωάννης
Αριθμός Μητρώου: ΤΛ20151
Θέμα:
Τίτλος στα ελληνικά: Ανάπτυξη και Σύγκριση Μεθοδολογιών Μηχανικής Μάθησης για την Αυτόματη Ανίχνευση Πολύποδων του Παχέος Εντέρου από Ενδοσκοπικές Εικόνες
Τίτλος στα αγγλικά:Development and comparison of machine learning methodologies for automatic detection of colorectal polyps from endoscopic images
Επιβλέπων:
Μπακλέζος Ανάργυρος, Επικ. Καθηγητής, Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ
Τριμελής Επιτροπή
- Βαρδιάμπασης Ιωάννης, Καθηγητής Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ
- Μπακλέζος Ανάργυρος, Επικ. Καθηγητής, Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ
- Νικολόπουλος Χρήστος, Αναπλ. Καθηγητής Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ
Περίληψη
Η παρούσα διπλωματική εργασία εστιάζει στην ανάπτυξη, αξιολόγηση και σύγκριση μεθοδολογιών μηχανικής και βαθιάς μάθησης για την αυτόματη ανίχνευση πολυπόδων του παχέος εντέρου από ενδοσκοπικές εικόνες. Στόχος είναι η δημιουργία ενός αξιόπιστου συστήματος υποβοήθησης διαγνώσεων (CAD) ικανό να ενισχύσει την ακρίβεια των κολονοσκοπήσεων, να μειώσει το ποσοστό παράλειψης πολυπόδων και να συμβάλει αποτελεσματικά στην πρόληψη του καρκίνου του παχέος εντέρου, ο οποίος παραμένει μια από τις κύριες αιτίες θανάτου παγκοσμίως.
Αρχικά παρουσιάζεται το κλινικό και επιδημιολογικό υπόβαθρο των πολυπόδων, αναλύονται οι υφιστάμενες τεχνικές τεχνητής νοημοσύνης στο πεδίο της ιατρικής απεικόνισης και τα διαθέσιμα σύνολα δεδομένων. Στη συνέχεια, εξετάζονται βασικές αρχιτεκτονικές βαθιάς μάθησης, με ιδιαίτερη έμφαση στα Συνελικτικά Νευρωνικά Δίκτυα (CNNs) και τη στρατηγική της μεταφορά μάθησης. Για την υλοποίηση του συστήματος, επιλέχθηκε η αποδοτική αρχιτεκτονική EfficientNetB3, η οποία προσαρμόστηκε και βελτιστοποιήθηκε μέσω fine-tuning σε ένα ευρύ σύνολο δεδομένων πραγματικών κολονοσκοπικών εικόνων από το σύνολο δεδομένων REAL-colon.
Η μεθοδολογία περιλαμβάνει σχολαστική προεπεξεργασία, επαύξηση δεδομένων (data augmentation) και στρατηγικές για τη διαχείριση της έντονης ανισορροπίας μεταξύ θετικών και αρνητικών καρέ. Το τελικό μοντέλο αξιολογήθηκε σε ανεξάρτητο σύνολο ελέγχου, επιδεικνύοντας ανώτερη απόδοση με ακρίβεια (accuracy) 91,4%, ευαισθησία (recall) 92,3%, ακρίβεια προβλέψεων (precision) 89,6% και F1-score 90,9%. Η καμπύλη ROC (AUC=0,945) επιβεβαίωσε την υψηλή διακριτική ικανότητα του συστήματος. Επιπλέον, με την εφαρμογή της τεχνικής Grad-CAM, παρέχεται οπτική επισήμανση των περιοχών της εικόνας που επηρέασαν κρίσιμα την πρόβλεψη του μοντέλου, προσφέροντας ένα επίπεδο διαφάνειας και ερμηνευσιμότητας (Explainable AI).
Η εργασία ολοκληρώνεται με την αναγνώριση περιορισμών και με προτάσεις για μελλοντική έρευνα, συμπεριλαμβανομένης της χρήσης πιο εξελιγμένων αρχιτεκτονικών (π.χ., transformers) και της ενσωμάτωσης χρονικής πληροφορίας από ακολουθίες βίντεο. Το προτεινόμενο σύστημα αποτελεί ένα ισχυρό θεμέλιο για την ανάπτυξη κλινικά χρήσιμων εργαλείων που θα υποστηρίξουν τους ενδοσκόπους στην επίτευξη υψηλότερων ποσοστών ανίχνευσης και, εν τέλει, στην αποτελεσματικότερη πρόληψη του καρκίνου του παχέος εντέρου.
Abstract
This thesis focuses on the development, evaluation, and comparison of machine and deep learning methodologies for the automatic detection of colorectal polyps from endoscopic images. The goal is to create a reliable computer-aided diagnosis (CAD) system capable of enhancing the accuracy of colonoscopies, reducing the polyp miss rate, and effectively contributing to the prevention of colorectal cancer, which remains a leading cause of death globally.
First, the clinical and epidemiological background of polyps is presented, existing artificial intelligence techniques in the field of medical imaging are analyzed, and available datasets are reviewed. Subsequently, fundamental deep learning architectures are examined, with particular emphasis on Convolutional Neural Networks (CNNs) and the transfer learning strategy. For the system’s implementation, the efficient EfficientNetB3 architecture was chosen, adapted, and optimized via fine-tuning on a large dataset of real colonoscopy images from the REAL-colon dataset.
The methodology includes meticulous preprocessing, data augmentation, and strategies to handle the severe imbalance between positive and negative frames. The final model was evaluated on an independent test set, demonstrating superior performance with an accuracy of 91.4%, sensitivity (recall) of 92.3%, precision of 89.6%, and an F1-score of 90.9%. The ROC curve (AUC=0.945) confirmed the system’s high discriminative ability. Furthermore, by applying the Grad-CAM technique, visual highlighting of the image regions that critically influenced the model’s prediction is provided, offering a level of transparency and interpretability (Explainable AI).
The work concludes by acknowledging limitations—such as the difficulty in detecting very small or flat polyps—and by proposing directions for future research, including the use of more advanced architectures (e.g., transformers) and the integration of temporal information from video sequences. The proposed system constitutes a strong foundation for the development of clinically useful tools that will support endoscopists in achieving higher detection rates and, ultimately, in the more effective prevention of colorectal cancer.
Λέξεις – Κλειδιά
Ανίχνευση πολυπόδων, βαθιά μάθηση, συνελικτικά νευρωνικά δίκτυα (CNN), EfficientNet, μεταφορά μάθησης, ενδοσκοπική απεικόνιση, διάγνωση με υποβοήθεια υπολογιστή (CAD), καρκίνος παχέος εντέρου, κολονοσκόπηση, REAL-colon dataset.
Keywords
Polyp detection, deep learning, convolutional neural networks (CNN), EfficientNet, transfer learning, endoscopic imaging, computer-aided diagnosis (CAD), colorectal cancer, colonoscopy, REAL-colon dataset.
Ημερομηνία Εξέτασης: Τετάρτη, 8 Απριλίου 11:30 πμ – 12:30 μμ
Χώρος Εξέτασης: Διαδικτυακά μέσω Google Meet:
