Τον κίνδυνο της ψηφιακής εξαφάνισης
αντιμετωπίζουν τουλάχιστον 21 ευρωπαϊκές γλώσσες, μεταξύ των οποίων και η
ελληνική, σύμφωνα με πρόσφατη μελέτη. Πρόκειται για τις γλώσσες που δεν υποστηρίζονται
επαρκώς από τη γλωσσική τεχνολογία, δηλαδή δεν ενσωματώνονται σε υπολογιστικές
εφαρμογές, συστήματα πληροφορικής και επικοινωνιακής τεχνολογίας. Με άλλα
λόγια, γλώσσες που δεν χρησιμοποιούμε στην ψηφιακή μας ζωή.
Η μελέτη, τα αποτελέσματα της οποίας
δημοσιεύει η εφημερίδα «Η Καθημερινή», καταρτίστηκε από περισσότερους από 200
ειδικούς του δικτύου ευρωπαϊκών ερευνητικών κέντρων ΜΕΤΑ-ΝΕΤ. Αξιολογώντας το
επίπεδο της υποστήριξης που παρέχει η γλωσσική τεχνολογία, όσον αφορά την
αυτόματη μετάφραση, τη φωνητική αλληλεπίδραση, την ανάλυση κειμένου και τη
διαθεσιμότητα γλωσσικών πόρων σε 30 ευρωπαϊκές γλώσσες, οι ειδικοί κατέληξαν
ότι η ψηφιακή υποστήριξη σε 21 απ’ αυτές είναι από ανεπαρκής έως ανύπαρκτη.
Τη χαμηλότερη βαθμολογία στις περισσότερες
«περιοχές» συγκέντρωσαν τα ισλανδικά, τα λετονικά, τα λιθουανικά και τα
μαλτέζικα. Στο άλλο άκρο της κατάταξης, μόνο η αγγλική γλώσσα αξιολογήθηκε ότι
έχει «καλή υποστήριξη», ενώ δεν υπάρχει καμία γλώσσα με «άριστη υποστήριξη».
Ακολουθούν τα γαλλικά, τα γερμανικά, τα
ιταλικά, τα ισπανικά και τα ολλανδικά με «μέτρια υποστήριξη», ενώ γλώσσες όπως
τα ελληνικά, τα βασκικά, τα βουλγαρικά, τα καταλανικά, τα ουγγρικά και τα
πολωνικά έχουν «αποσπασματική υποστήριξη» και ως εκ τούτου ανήκουν στις γλώσσες
υψηλού κινδύνου.
Απ’ την έρευνα αποκαλύφθηκε ότι το χάσμα μεταξύ των λεγόμενων «μικρών» και «μεγάλων» γλωσσών ολοένα διευρύνεται αντί να συρρικνώνεται. Όπως τονίζουν οι επιμελητές της μελέτης, οι περισσότερες ευρωπαϊκές γλώσσες παρουσιάζουν μεγάλες ελλείψεις σε γλωσσικούς πόρους, ενώ κάποιες από αυτές είναι τελείως παραμελημένες και είναι δύσκολο να διασφαλιστεί το ψηφιακό τους μέλλον.
Απ’ την έρευνα αποκαλύφθηκε ότι το χάσμα μεταξύ των λεγόμενων «μικρών» και «μεγάλων» γλωσσών ολοένα διευρύνεται αντί να συρρικνώνεται. Όπως τονίζουν οι επιμελητές της μελέτης, οι περισσότερες ευρωπαϊκές γλώσσες παρουσιάζουν μεγάλες ελλείψεις σε γλωσσικούς πόρους, ενώ κάποιες από αυτές είναι τελείως παραμελημένες και είναι δύσκολο να διασφαλιστεί το ψηφιακό τους μέλλον.
Τι συμβαίνει όμως ειδικά με τα ελληνικά;
«Τα ελληνικά είναι μία από τις γλώσσες με μικρό αριθμό ομιλητών και μικρό όγκο
ψηφιακών γλωσσικών πόρων και τεχνολογιών», σημειώνουν οι συγγραφείς της
αντίστοιχης ελληνικής μελέτης.
Η γλωσσική τεχνολογία παράγει λογισμικό που
επεξεργάζεται τον προφορικό και το γραπτό λόγο. Χαρακτηριστικά παραδείγματα
λογισμικού είναι οι ορθογραφικοί και συντακτικοί διορθωτές, οι διαδραστικοί
προσωπικοί βοηθοί στα έξυπνα τηλέφωνα (όπως η Siri στο iPhone), τα διαλογικά
συστήματα μέσω τηλεφώνου, τα συστήματα αυτόματης μετάφρασης, οι μηχανές
αναζήτησης στο Διαδίκτυο και η συνθετική φωνή σε συστήματα πλοήγησης στα
αυτοκίνητα.
Το πρόβλημα είναι ότι τα σύγχρονα συστήματα
γλωσσικής τεχνολογίας βασίζονται κυρίως σε στατιστικές μεθόδους που απαιτούν
πολύ μεγάλες ποσότητες προφορικών και γραπτών δεδομένων. Όταν λοιπόν πρόκειται
για γλώσσες με σχετικά λίγους ομιλητές, ο απαραίτητος όγκος δεδομένων είναι
πολύ δύσκολο να βρεθεί.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου