Σήμερα, κατά τη διάρκεια της κεντρικής ομιλίας του Google IO 2022, ο Διευθύνων Σύμβουλος της Google, Sundar Pichai, ανακοίνωσε ότι η εταιρεία θα φέρει 24 νέες γλώσσες στο Google I/O, στοχεύοντας γλώσσες που «υποεκπροσωπούνται σήμερα στον Ιστό».
«Περισσότεροι άνθρωποι χρησιμοποιούν το Google Translate από ποτέ, αλλά έχουμε ακόμα δουλειά να κάνουμε για να το κάνουμε παγκοσμίως προσβάσιμο», είπε ο Pichai.
[su_button url=”https://itechnews.gr/2020/04/itechnews-gr-tora-pia-episima-kai-sta-google/” target=”blank” style=”bubbles” background=”#5d9e17″ color=”#ffffff” size=”10″ wide=”yes” center=”yes” radius=”20″ icon=”https://itechnews.gr/wp-content/uploads/2021/08/google_news.jpg” icon_color=”#060606″ text_shadow=”2px 2px 2px #000000″ rel=”lightbox”]Ακολουθήστε το iTechNews.gr στο Google News! Παρακολουθήστε τα τελευταία νέα, τάσεις, αξεσουάρ και παρουσιάσεις[/su_button]
Το Google Translate συνήθως βασίζεται στη “δίγλωσση μάθηση” για τη μετάφραση κειμένου, συγκρίνοντας φράσεις μεταξύ δύο γλωσσών για τη σωστή μετάφραση διαφορετικών φράσεων. Επειδή όμως αυτές οι νέες γλώσσες έχουν λιγότερο κείμενο για να εμβαθύνει η τεχνητή νοημοσύνη της Google, έπρεπε να βασιστεί στη «μονόγλωσση μάθηση», όπου «το μοντέλο μαθαίνει να μεταφράζει μια νέα γλώσσα χωρίς ποτέ να δει μετάφραση δεδομένων της».
[affcoups id=”96094″]
Οι 24 γλώσσες που αναφέρονται παρακάτω καλύπτουν περίπου 310 εκατομμύρια ανθρώπους σε όλο τον κόσμο και περιλαμβάνουν τρεις γλώσσες ιθαγενών της Αμερικής (Κέτσουα, Γκουαρανί και Αϊμάρα) και μια αγγλική διάλεκτο (Sierra Leonean Krio), οι οποίες είναι οι πρώτες για το Google Translate.
[affcoups id=”96103″]
- Assamese, που χρησιμοποιείται από περίπου 25 εκατομμύρια ανθρώπους στη βορειοανατολική Ινδία
- Aymara, που χρησιμοποιείται από περίπου δύο εκατομμύρια ανθρώπους στη Βολιβία, τη Χιλή και το Περού
- Bambara, που χρησιμοποιείται από περίπου 14 εκατομμύρια ανθρώπους στο Μάλι
- Bhojpuri, που χρησιμοποιείται από περίπου 50 εκατομμύρια ανθρώπους στη βόρεια Ινδία, το Νεπάλ και τα Φίτζι
- Ντιβέχι, που χρησιμοποιείται από περίπου 300.000 άτομα στις Μαλδίβες
- Dogri, που χρησιμοποιείται από περίπου τρία εκατομμύρια ανθρώπους στη βόρεια Ινδία
- Προβατίνα, που χρησιμοποιείται από περίπου επτά εκατομμύρια ανθρώπους στην Γκάνα και το Τόγκο
- αρανί, που χρησιμοποιείται από περίπου επτά εκατομμύρια ανθρώπους στην Παραγουάη και τη Βολιβία, την Αργεντινή και τη Βραζιλία
- Ilocano, που χρησιμοποιείται από περίπου 10 εκατομμύρια ανθρώπους στις βόρειες Φιλιππίνες
- Konkani, που χρησιμοποιείται από περίπου δύο εκατομμύρια ανθρώπους στην Κεντρική Ινδία
- Krio, που χρησιμοποιείται από περίπου τέσσερα εκατομμύρια άτομα στη Σιέρα Λεόνε
- Κουρδικά (Σοράνι), που χρησιμοποιείται από περίπου οκτώ εκατομμύρια ανθρώπους, κυρίως στο Ιράκ
- Lingala, που χρησιμοποιείται από περίπου 45 εκατομμύρια ανθρώπους στη Λαϊκή Δημοκρατία του Κονγκό, τη Δημοκρατία του Κονγκό, την Κεντροαφρικανική Δημοκρατία, την Αγκόλα και τη Δημοκρατία του Νοτίου Σουδάν
- Λουγκάντα, που χρησιμοποιείται από περίπου 20 εκατομμύρια ανθρώπους στην Ουγκάντα και τη Ρουάντα
- Maithili, που χρησιμοποιείται από περίπου 34 εκατομμύρια ανθρώπους στη βόρεια Ινδία
- Meiteilon (Manipuri), που χρησιμοποιείται από περίπου δύο εκατομμύρια ανθρώπους στη βορειοανατολική Ινδία
- Mizo, που χρησιμοποιείται από περίπου 830.000 άτομα στη βορειοανατολική Ινδία
- Oromo, που χρησιμοποιείται από περίπου 37 εκατομμύρια ανθρώπους στην Αιθιοπία και την Κένυα
- Κέτσουα, που χρησιμοποιείται από περίπου 10 εκατομμύρια ανθρώπους στο Περού, τη Βολιβία, τον Ισημερινό και τις γύρω χώρες
- Σανσκριτικά, που χρησιμοποιούνται από περίπου 20.000 άτομα στην Ινδία
- Sepedi, που χρησιμοποιείται από περίπου 14 εκατομμύρια ανθρώπους στη Νότια Αφρική
- Tigrinya, που χρησιμοποιείται από περίπου οκτώ εκατομμύρια ανθρώπους στην Ερυθραία και την Αιθιοπία
- Tsonga, που χρησιμοποιείται από περίπου επτά εκατομμύρια ανθρώπους στο Eswatini, τη Μοζαμβίκη, τη Νότια Αφρική και τη Ζιμπάμπουε
- Twi, που χρησιμοποιείται από περίπου 11 εκατομμύρια ανθρώπους στην Γκάνα
Οι Isaac Caswell και Ankur Bapna, ερευνητές για το Google Translate, έγραψαν μια τεχνική ανάρτηση στο Google AI Blog που περιγράφει λεπτομερώς τον τρόπο λειτουργίας των εργαλείων της νέας μονόγλωσσης μετάφρασής τους ή της “μετάφρασης μηδενικών πόρων”. Είναι τεχνικά πυκνό, αλλά εξηγεί πώς η Google δημιούργησε σύνολα δεδομένων για 1138 γλώσσες προκειμένου να “μάθουν αναπαραστάσεις γλωσσών που δεν διαθέτουν πόρους απευθείας από μονόγλωσσο κείμενο”.
Το Google Translate έχει προχωρήσει πολύ τα τελευταία χρόνια. Πρόσφατα Pixel, όπως το Pixel 6, μπορούν να μεταφράσουν ζωντανά προφορικές λέξεις ή κείμενο που προβάλλονται μέσω κάμερας από δεκάδες γλώσσες. Τώρα, τα τηλέφωνα Android θα γίνουν πιο χρήσιμα για κοινότητες σε όλο τον κόσμο που ιστορικά έχουν μείνει πίσω από την τεχνολογία που στοχεύει μόνο λίγες γλώσσες.
[affcoups id=”95841″]
Σε άλλες ειδήσεις του Google IO που σχετίζονται με τη γλώσσα, ο Pichai σημείωσε ότι οι υπότιτλοι του YouTube που δημιουργούνται αυτόματα είναι πλέον διαθέσιμοι σε 16 γλώσσες.
[signoff]