Τμήμα Ηλεκτρονικών Μηχανικών

Ελληνικό Μεσογειακό Πανεπιστήμιο

23/09/2024: Παρουσίαση μεταπτυχιακής διπλωματικής εργασίας (ΠΜΣ ΗΣΤΑ) B. Παπαβασιλείου

Παρουσίαση Μεταπτυχιακής Διπλωματικής Εργασίας ΠΜΣ ΗΣΤΑ Τμήματος Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ

Ονοματεπώνυμο: Παπαβασιλείου Βλάσιος
Αριθμός Μητρώου: ΜΤ10

Θέμα
Τίτλος στα ελληνικά: Αύξηση της εισροής τουριστών δια της στοχευμένης προώθησης δραστηριοτήτων των τοπικών κοινωνιών σε σελίδες κοινωνικής δικτύωσης βάσει των εξατομικευμένων ενδιαφερόντων των χρηστών
Τίτλος στα αγγλικά: “Increase of tourist influx through the promotion of local community activities on social media pages based on personalized user interests”

Επιβλέπων
Κωνσταντάρας Αντώνιος, Καθηγητής Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ

Τριμελής Επιτροπή
1. Βαρδιάμπασης Ιωάννης, Καθηγητής Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ
2. Κωνσταντάρας Αντώνιος, Καθηγητής Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ

3. Μαραβελάκης Εμμανουήλ, Καθηγητής Τμ. Ηλεκτρονικών Μηχανικών ΕΛΜΕΠΑ

Περίληψη
Η εργασία αυτή εξετάζει τις δυνατότητες που παρέχουν οι νέες τεχνολογίες στην έρευνα διά της συλλογής και επεξεργασίας δεδομένων τα οποία εκουσίως αναρτούν οι χρήστες των Μέσων Κοινωνικής Δικτύωσης σε μορφή γραπτού λόγου. Εξεταζεται η περίπτωση του X(πρώην Twitter), μιας εφαρμογής μικροαναρτήσεων η οποία επικεντρώνεται κυρίως στην γραπτή έκφραση των χρηστών ως προς τη στάση τους και τη διάθεσή τους προς διάφορα θέματα, πρόσωπα και καταστάσεις. Σκοπός της εργασίας είναι να εξετάσει τρόπους στοχευμένης διάδοσης τουριστικών προορισμών σε χρήστες των ΜΚΔ βάσει των προτιμήσεών τους.
Η συλλογή δεδομένων έγινε με τη χρήση δύο μεθόδων: γεωγραφικά, χρησιμοποιώντας την επισήμανση της γεωγραφικής περιοχής βάσει συντεταγμένων και με χρήση ενός ή περισσοτέρων hashtags και λέξεων κλειδιών.
Για την αξιοποίηση των δεδομένων των χρηστών που προκύπτουν από τις αναρτήσεις τους, χρησιμοποιήθηκε η δυνατότητα που μας δίνει η διασύνδεση του προγράμματός, γραμμενο σε Python, με το REST API του Χ. Τα γλωσσικά εργαλεία που χρησιμοποιήθηκαν στον κώδικα του προγράμματος είναι το NLTK, μία πλατφόρμα εργαλείων επεξεργασίας φυσικής γλώσσας και η βιβλιοθήκη λέξεων Wordnet. Για τον καθαρισμό από περιττά μέρη του λόγου χρησιμοποιήθηκαν εκτενώς κανονικες εκφράσεις ενώ απομονώθηκαν τα ουσιαστικα τα οποία συνοδεύονται από θετικού νοήματος επίθετα.
Τα αποτελέσματα καταχωρούνται σε σχεσιακή βάση δεδομένων. Σε δεύτερο χρόνο αντλούνται από τη βάση δεδομένων και συγκρίνονται με θεματικά λεξιλόγια. Η συχνότητα των λέξεων κλειδιών που χρησιμοποιούνται από το χρήστη και ανήκουν σε συγκεκριμένη κατηγορία εξάγει το τελικό αποτέλεσμα με το όνομα χρήστη και τις 5 δημοφιλέστερες κατηγορίες που ταιριάζουν στο προφίλ του.

Abstract
This paper deals with the possibilities provided by new technologies in research through the collection and processing of data which are voluntarily posted by Social Media users in the form of written speech. The case of Χ is examined, a microblogging application that focuses mainly on the written expression of users in terms of their attitude and mood towards various topics, people and situations. The purpose of this paper is to examine ways of targeted dissemination of tourist destinations to users of SM.
Those data were collected using two methods: geographically, using geotagging based on coordinates and by reference, using one or more hashtags and keywords.
To take advantage of user data resulting from their posts, we used the ability provided by the interface of the program, written in Python, with the Χ API. The language tools used in the program code are NLTK, a natural language editing platform, and the Wordnet database which consists of words and terms. Normal expressions were used extensively to purify unnecessary parts of speech, while nouns accompanied by positive adjectives were isolated for further use.
The results have been recorded to a relational database. In the next phase, they are extracted from the database and compared with thematic vocabularies. The frequency of the keywords used by the user which are part of a specific category form the final result consisted by the users’s username and the 5 most popular categories that fits their profile.

Λέξεις – Κλειδιά
Χρήστες, αναρτήσεις, γλώσσα, επεξεργασία, κώδικας, λεξιλόγια.

Keywords
Users, posts, language, processing, code, vocabularies.

Ημερομηνία Εξέτασης: 23 Σεπτεμβρίου 2024, 10:00
Χώρος Εξέτασης: Εργ. ΤΥΠΗΚ, Τμ. Ηλεκτρονικών Μηχανικών, Κτίριο Α
Διαδικτυακά: https://us05web.zoom.us/j/2213237858?pwd=cUY4SllhQU9IaDZIdExXVWQwU3BKUT09

Μετάβαση στο περιεχόμενο