1.3 Ορισμός και Τύποι Τεχνητής Νοημοσύνης (ΤΝ)
Η Τεχνητή Νοημοσύνη (ΤΝ) αποτελεί έναν από τους πλέον καθοριστικούς παράγοντες της σύγχρονης τεχνολογικής εξέλιξης και επιδρά βαθιά σε κάθε πτυχή της ανθρώπινης ζωής. Ιδιαίτερη είναι η σημασία της στον τομέα της προσβασιμότητας, ειδικά για τα άτομα με οπτική αναπηρία, καθώς προσφέρει νέες δυνατότητες για ανεξαρτησία, ένταξη και αυτόνομη πρόσβαση στην πληροφορία. Για να κατανοήσουμε πώς η ΤΝ συμβάλλει σε αυτούς τους στόχους, είναι απαραίτητο να διερευνήσουμε τον ορισμό, τις βασικές της κατηγορίες και τεχνικές, καθώς και τις πρακτικές εφαρμογές της στην υποστήριξη ατόμων με απώλεια όρασης.
Η ΤΝ μπορεί να οριστεί ως η ικανότητα ενός υπολογιστικού συστήματος να εκτελεί γνωστικές λειτουργίες που σχετίζονται με την ανθρώπινη νοημοσύνη, όπως η λήψη αποφάσεων, η μάθηση, η αναγνώριση προτύπων, η επίλυση προβλημάτων και η κατανόηση φυσικής γλώσσας (Russell & Norvig, 2021). Ένα πιο λειτουργικό πλαίσιο προσφέρει ο Kaplan και ο Haenlein (2019), που ορίζουν την ΤΝ ως «την ικανότητα ενός συστήματος να ερμηνεύει εξωτερικά δεδομένα, να μαθαίνει από αυτά και να χρησιμοποιεί αυτή τη γνώση για την επίτευξη στόχων μέσω ευέλικτης προσαρμογής».
Η ΤΝ διακρίνεται γενικά σε δύο βασικούς τύπους: τη Στενή (Narrow AI) και τη Γενική Τεχνητή Νοημοσύνη (General AI). Η Στενή ΤΝ αναφέρεται σε εφαρμογές που εκτελούν συγκεκριμένες, περιορισμένες λειτουργίες — όπως η φωνητική υποβοήθηση ή η αναγνώριση εικόνων — και αποτελεί την πιο διαδεδομένη μορφή σήμερα. Παραδείγματα περιλαμβάνουν τα Siri, Alexa και Google Assistant. Αντιθέτως, η Γενική ΤΝ αναφέρεται σε ένα θεωρητικό στάδιο εξέλιξης όπου ένα σύστημα θα μπορεί να εκτελεί οποιαδήποτε νοητική εργασία είναι ικανός να εκτελέσει ένας άνθρωπος, κάτι που παραμένει προς το παρόν υποθετικό (Goertzel & Pennachin, 2007).
Οι τεχνικές της ΤΝ υλοποιούνται μέσα από διάφορες υποκατηγορίες, οι οποίες συνεργάζονται συχνά μεταξύ τους. Μία από τις βασικότερες είναι η ΜηχανΙκή Μάθηση (Machine Learning – ML). Η ML βασίζεται στην ιδέα ότι τα συστήματα μπορούν να “μάθουν” από δεδομένα και να βελτιώνουν την απόδοσή τους χωρίς ρητό προγραμματισμό. Στην επιβλεπόμενη μάθηση (supervised learning), το σύστημα εκπαιδεύεται με καθορισμένες εισόδους και εξόδους. Στην ανεπιβλεπόμενη μάθηση (unsupervised learning), το σύστημα αναζητά μοτίβα στα δεδομένα χωρίς ετικέτες. Η ενισχυτική μάθηση (reinforcement learning) επιτρέπει στο σύστημα να μαθαίνει μέσα από την επιβράβευση ή την τιμωρία για τις πράξεις του. Σε εφαρμογές για οπτικά ανάπηρους, χρησιμοποιείται ML για να αναγνωρίζει το σύστημα τις συνήθειες μετακίνησης του χρήστη, προβλέποντας διαδρομές και πιθανά εμπόδια (Naayini et al., 2025).
Ένα πιο εξελιγμένο υποσύνολο της ML είναι η Βαθιά Μάθηση (Deep Learning – DL), η οποία χρησιμοποιεί πολυεπίπεδα τεχνητά νευρωνικά δίκτυα για την επεξεργασία σύνθετων δεδομένων, όπως εικόνες ή ήχος. Η DL είναι η βάση πίσω από πολλές εφαρμογές αναγνώρισης εικόνας, όπως η αναγνώριση αντικειμένων ή προσώπων μέσω κάμερας σε πραγματικό χρόνο. Συστήματα όπως το Seeing AI και το Envision AI βασίζονται σε DL για να περιγράφουν οπτικές σκηνές ή να μετατρέπουν εικόνες σε φωνητικές περιγραφές (Gonzalez et al., 2024).
Μια άλλη καίρια τεχνολογία είναι η Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing – NLP), που επιτρέπει στους υπολογιστές να «καταλαβαίνουν» και να δημιουργούν ανθρώπινη γλώσσα. Χάρη στο NLP, οι φωνητικοί βοηθοί μπορούν να αλληλεπιδρούν με χρήστες σε καθημερινή γλώσσα, να διαβάζουν κείμενα δυνατά ή να μεταφράζουν προφορικά εντολές σε ενέργειες. Το NLP χρησιμοποιείται ευρέως σε εφαρμογές όπως οι αναγνώστες οθόνης και τα συστήματα ανάγνωσης εγγράφων για άτομα με τύφλωση.
Η Υπολογιστική Όραση (Computer Vision) είναι ένας ακόμα κρίσιμος τομέας, ο οποίος επιτρέπει στα συστήματα να ερμηνεύουν δεδομένα από εικόνες ή βίντεο. Με τη βοήθεια κάμερας και αλγορίθμων, οι συσκευές μπορούν να αναγνωρίζουν πρόσωπα, να διαβάζουν πινακίδες, να εντοπίζουν εμπόδια ή να περιγράφουν το περιβάλλον. Τέτοιες τεχνολογίες έχουν αξιοποιηθεί σε “έξυπνα” γυαλιά ή κινητές εφαρμογές, προσφέροντας real-time καθοδήγηση και πληροφορία σε τυφλά άτομα (Power et al., 2023).
Η Αναγνώριση Ομιλίας (Speech Recognition) αποτελεί άλλη μία βασική εφαρμογή της ΤΝ, επιτρέποντας τη μετατροπή του προφορικού λόγου σε κείμενο. Αυτή η τεχνολογία είναι κρίσιμη για φωνητικές εντολές, υπαγόρευση μηνυμάτων ή αλληλεπίδραση με συσκευές χωρίς ανάγκη για απτική επαφή. Είναι ιδιαίτερα χρήσιμη για άτομα με χαμηλή όραση ή τύφλωση που επιθυμούν να διαχειρίζονται το κινητό τους, να αναζητούν πληροφορίες ή να πλοηγούνται στο διαδίκτυο.
Οι πιο καινοτόμες λύσεις συνδυάζουν αυτές τις τεχνολογίες, δημιουργώντας προηγμένα συστήματα υποστήριξης. Για παράδειγμα, εφαρμογές που ενσωματώνουν υπολογιστική όραση, βαθιά μάθηση και NLP επιτρέπουν σε έναν χρήστη με οπτική αναπηρία να τραβήξει μια φωτογραφία ενός αντικειμένου και να λάβει προφορική περιγραφή ή να ρωτήσει το κινητό του πού βρίσκεται το πλησιέστερο φανάρι πεζών. Η προσαρμοστικότητα αυτών των συστημάτων μέσω ML επιτρέπει επίσης την εξατομίκευση ανάλογα με τις συνήθειες, τοποθεσία και ανάγκες του εκάστοτε χρήστη.
Συμπερασματικά, η Τεχνητή Νοημοσύνη έχει εξελιχθεί σε καταλύτη της κοινωνικής ένταξης και ανεξαρτησίας των ατόμων με οπτική αναπηρία. Οι εφαρμογές της ξεπερνούν τα απλά βοηθήματα και οδηγούν σε μια νέα εποχή προσβασιμότητας, όπου η τεχνολογία προσαρμόζεται στον χρήστη, και όχι το αντίστροφο.
