Ονοματεπώνυμο: Παντεράκη Μυρτώ του Δημητρίου
Αριθμός Μητρώου: ΤΛ20138
Θέμα:
Τίτλος στα ελληνικά: Ιχνηλάτηση προσανατολισμού με κάμερα
Τίτλος στα αγγλικά: Tracking orientation with camera
Επιβλέπων:
Επιβλέπων: Καθηγητής κ. Αντώνιος Κωνσταντάρας
Περίληψη
Εισαγωγή: Οι πιο σημαντικές πτυχές της όρασης και της ανίχνευσης των ματιών είναι αυτές που μπορούν να αναπτυχθούν για τη δημιουργία εφαρμογών συστημάτων παρακολούθησης των ματιών, εικονικής πραγματικότητας και επαυξημένης πραγματικότητας, καθώς και διαδραστικών χώρων. Ταυτόχρονα, αυτή η μέθοδος έχει εφαρμοστεί εκτενώς στην ιατρική: η χρήση στον τομέα της διάγνωσης νευρολογικών παθήσεων μέσω της παρατήρησης των κινήσεων των ματιών και της κίνησης των ματιών κατά τη διάρκεια της παρατήρησης ενός ασθενούς με οπτικά προβλήματα και της θεραπείας παρέμβασης που περιλαμβάνει την ακριβή μέτρηση της κίνησης των ματιών. Το παρόν άρθρο έχει ως στόχο την κωδικοποίηση σε Python ενός συστήματος παρακολούθησης των κινήσεων των ματιών σε πραγματικό χρόνο με βάση το OpenCV και το Dlib. Μέσω της κάμερας της συσκευής, είναι σε θέση να εντοπίζει τα μάτια και να εμφανίζει τις συντεταγμένες των ματιών ως (XYZ) του τρισδιάστατου χώρου.
Σκοπός: η εργασία πραγματοποιήθηκε με σκοπό την ανάπτυξη μιας πραγματικής εφαρμογής παρακολούθησης των ματιών για την άμεση αναγνώριση των τρισδιάστατων συντεταγμένων των ματιών. Έχει διάφορους στόχους: παρατήρηση της θέσης των ματιών, μελέτη της ανθρώπινης δραστηριότητας, διαδραστικά έργα και υποστήριξη διαφόρων ιατρικών εφαρμογών.
Μεθοδολογία: Αναπτύχθηκε στη γλώσσα προγραμματισμού Python, με τη βοήθεια βιβλιοθηκών που ονομάζονται OpenCV και Dlib. Κεντρικό στοιχείο της μεθοδολογίας ήταν η διαδικασία βαθμονόμησης της κάμερας, η οποία, σύμφωνα με την επιστημονική μεθοδολογία, επιτρέπει τη διόρθωση των παραμορφώσεων σε έναν φακό και την ακρίβεια των υπολογισμών συντεταγμένων.
Αποτελέσματα: Προσεγγίζει το πλέγμα με αρκετά ακριβή τρόπο, παρέχοντας συντεταγμένες 3D σε πραγματικό χρόνο. Το εργαλείο έχει επίσης αποδειχθεί αποτελεσματικό υπό διαφορετικές συνθήκες φωτισμού, γωνίες θέασης και κίνηση του κεφαλιού, σύμφωνα με δοκιμές.
Συζήτηση – Συμπεράσματα: Η χρήση της τοποθέτησης πλέγματος 3D έχει διευρύνει ένα νέο πεδίο θέασης σε διαδραστικά συστήματα και ιατρικές διαγνώσεις. Οι δυνατότητες που μπορούν να υλοποιηθούν σε σχέση με τη μελλοντική επέκταση είναι η ενσωμάτωση της μηχανικής μάθησης για την ενίσχυση της ικανότητας ανίχνευσης του έργου, καθώς και η χρήση πολλαπλών καμερών για την πραγματοποίηση πιο ακριβών μετρήσεων.
Abstract
Introduction: The most important aspects of seeing an eye and detecting it are the ones that may be developed to create eye tracking systems applications, virtual reality and augmented reality and interactive spaces. Simultaneously, this method has been extensively implemented in medicine: the use in the field of the diagnosis of neurological diseases by observing eye movements and eye movement during the period of observing a patient with visual problems and intervention therapy involving precise measurement of eye movement. This paper is aimed at coding in Python a real-time monitoring system of eye movements based on OpenCV and Dlib. Through the camera of the device, it is capable of locating the eyes and show coordinates of the eyes as (XYZ) of the three dimensional space.
Purpose: the work was carried out to come up with the actual eye tracking application to directly identify the 3D coordinates of the eyes. It has several objectives: observation of eye position, the study of human activity, interactive projects, and assistance to different medical applications.
Methodology: It is developed in Python programming language, with the help of libraries called OpenCV and Dlib. Central to the methodology was the process of camera calibration, which, according to the scientific methodology, allows the correction of distortions in a lens and the accuracy of coordinate calculations.
Results: It approximates the grid in a considerably accurate way, giving real time 3D coordinates. The tool is also proved to be efficient under diverse lighting conditions, angles of view and the head movement by tests.
Discussion – Conclusions: The use of the 3D mesh positioning has broadened a new field of view in interactive systems and medical diagnostics. The possibilities to be realized vis-a-vis future expansion are the possibilities to incorporate machine learning to enhance the detection capacity of the project, as well as the use of multiple cameras to take more accurate measurements.
Ημερομηνία Εξέτασης: 28 Ιουλίου 2025 ,08:30 π.μ.
Χώρος Εξέτασης: Αίθουσα Συνεδριάσεων, νέο κτήριο