Τεχνητή Νοημοσύνη και Άτομα με Οπτική Αναπηρία: Εφαρμογές και Τεχνολογίες Προσβασιμότητας – ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ της ΠΑΠΑΕΥΘΥΜΙΟΥ ΣΤΑΥΡΟΥΛΑΣ – ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ, ΠΜΣ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΤΗΣ ΑΓΩΓΗΣ: ΕΙΔΙΚΗ ΑΓΩΓΗ, ΕΚΠΑΙΔΕΥΣΗ ΚΑΙ ΑΠΟΚΑΤΑΣΤΑΣΗ – Μέρος 12ο

Δεκ 30, 2025 | Άλλες προσεγγίσεις της τυφλότητας και της αναπηρίας, ΠΟΛΙΤΙΣΜΟΣ

1.4.2   Τεχνολογίες Αναγνώρισης Αντικειμένων και Προσώπων

Οι τεχνολογίες αναγνώρισης αντικειμένων και προσώπων ενσωματώνουν μερικές από τις πιο εξελιγμένες εφαρμογές της υπολογιστικής όρασης και της βαθιάς μάθησης (deep learning) για την παροχή ενός είδους «τεχνητής όρασης» στους χρήστες με οπτική αναπηρία. Η βασική λειτουργία τους είναι να συλλέγουν οπτικά δεδομένα μέσω  καμερών,  να  τα  επεξεργάζονται  με  τη  βοήθεια  νευρωνικών  δικτύων εκπαιδευμένων σε τεράστια σύνολα εικόνων και να παρέχουν περιγραφές ή ειδοποιήσεις στον χρήστη με ακουστικό ή απτικό τρόπο.

Οι συγκεκριμένες τεχνολογίες λειτουργούν σε διάφορα επίπεδα. Αρχικά, επιτρέπουν την αναγνώριση απλών αντικειμένων καθημερινής χρήσης, όπως έπιπλα, σκεύη, ή συσκευές, γεγονός που διευκολύνει δραστικά την καθημερινή διαβίωση. Σε πιο εξελιγμένο επίπεδο, μπορούν να εντοπίσουν πρόσωπα, να τα αναγνωρίσουν εφόσον είναι καταχωρημένα στη συσκευή και να παρέχουν πληροφορίες για την έκφραση του προσώπου, την ηλικία, το φύλο ή τη συναισθηματική κατάσταση, λειτουργίες που ενισχύουν σημαντικά την κοινωνική αλληλεπίδραση.

Ένα από τα πιο χαρακτηριστικά παραδείγματα είναι η εφαρμογή Seeing AI της Microsoft, η οποία έχει σχεδιαστεί ειδικά για άτομα με προβλήματα όρασης. Η εφαρμογή χρησιμοποιεί την κάμερα του κινητού τηλεφώνου και αναλύει σε πραγματικό χρόνο το οπτικό πεδίο. Έπειτα, προσφέρει στον χρήστη φωνητική περιγραφή του τι βλέπει, όπως για παράδειγμα την ταυτότητα ή τα χαρακτηριστικά ενός προσώπου, το κείμενο μιας επιγραφής, ή την κατηγορία ενός αντικειμένου. Επιπλέον, είναι σε θέση να διαβάζει χειρόγραφα σημειώματα ή ετικέτες, διευκολύνοντας τις καθημερινές δραστηριότητες όπως η αναγνώριση προϊόντων (Power et al., 2023).

Η εφαρμογή Envision AI ακολουθεί μια παρόμοια προσέγγιση, αλλά ενσωματώνει επιπλέον δυνατότητες μέσω έξυπνων γυαλιών. Οι εικόνες καταγράφονται από την κάμερα των γυαλιών και αποστέλλονται μέσω cloud σε εξειδικευμένους αλγορίθμους που επεξεργάζονται και αποδίδουν ηχητικές περιγραφές για το τι υπάρχει μπροστά στον χρήστη. Αυτό το χαρακτηριστικό είναι ιδιαιτέρως χρήσιμο σε περιπτώσεις όπου η χρήση τηλεφώνου δεν είναι πρακτική ή εφικτή, όπως κατά τη διάρκεια της μετακίνησης ή σε δημόσιους χώρους με απαιτήσεις hands-free λειτουργίας (Gonzalez et al., 2024).

Οι τεχνολογίες αναγνώρισης αντικειμένων και προσώπων δεν προσφέρουν απλώς πληροφόρηση, αλλά επεκτείνουν την εμπειρία του χρήστη προς μια νέα διάσταση κοινωνικής ένταξης, ανεξαρτησίας και ψυχολογικής ασφάλειας. Η δυνατότητα να γνωρίζει κανείς ποιος βρίσκεται μπροστά του ή τι αντικείμενα υπάρχουν σε έναν χώρο, χωρίς να χρειάζεται εξωτερική βοήθεια, είναι καθοριστική για την ενίσχυση της αυτοπεποίθησης και της αλληλεπίδρασης με το κοινωνικό περιβάλλον.

 

 

Μετάβαση στο περιεχόμενο