Είμαστε πιο κοντά από ποτέ στην «αθανασία» μέσω AI χάρη στη νέα τεχνολογία φωνής της Meta

Οι ραγδαίες εξελίξεις στο χώρο της τεχνητής νοημοσύνης συνεχίζονται και τώρα η Meta έκανε ένα σημαντικό βήμα προς την «αθανασία» μέσω AI, με την παρουσίαση του Voicebox, ενός εξελιγμένου μοντέλου παραγωγής φωνής από κείμενο. Αυτή η νέα τεχνητή νοημοσύνη φιλοδοξεί να κάνει ότι κατάφερε το ChatGPT για το κείμενο και το Dall-E για τη δημιουργία εικόνων, παράγοντας τρομερά ρεαλιστικά ηχητικά αποσπάσματα από κείμενο. Θεωρητικά, με το Voicebox, η φωνή οποιοδήποτε διάσημου και όχι μόνο θα μπορούσε να συνεχίσει να χρησιμοποιείται ακόμη και μετά το θάνατό του.
Σύμφωνα με τη Meta, το Voicebox λειτουργεί ως ένα “non-autoregressive flow-matching” μοντέλο που έχει εκπαιδευτεί για να συμπληρώνει την ομιλία, δεδομένου του ηχητικού πλαισίου και του κειμένου. Η τεχνητή νοημοσύνη εκπαιδεύτηκε με περισσότερες από 50.000 ώρες δεδομένων ήχου από δημόσια προσβάσιμα audiobooks σε διάφορες γλώσσες, συμπεριλαμβανομένων των αγγλικών, γαλλικών, ισπανικών, γερμανικών, πολωνικών και πορτογαλικών. Αυτό το πλούσιο και ποικιλόμορφο σύνολο δεδομένων επιτρέπει στο Voicebox να δημιουργεί ομιλία που ακούγεται σαν πραγματική, ανεξάρτητα από τη γλώσσα. Μάλιστα, το εντυπωσιακό είναι ότι η συνθετική ομιλία που παράγεται από το Voicebox είχε ποσοστό σφάλματος μόνο 1%, μια σημαντική βελτίωση σε σύγκριση με την κατά 45 έως 70% εξασθένιση που παρατηρείται στα υπάρχοντα μοντέλα μετατροπής κειμένου σε ομιλία (TTS).Είμαστε πιο κοντά από ποτέ στην «αθανασία» μέσω AI χάρη στη νέα τεχνολογία φωνής της MetaΗ καινοτόμος διαδικασία εκπαίδευσης περιλάμβανε μεταξύ άλλων τη δυνατότητα του μοντέλου να προβλέπει τμήματα ομιλίας με βάση το περιβάλλον και το σχετικό κείμενο. Όπως περιγράφουν οι ερευνητές της Meta, αυτό επιτρέπει στο μοντέλο να παράγει συγκεκριμένα τμήματα μιας ηχογράφησης, χωρίς να αναδημιουργεί ολόκληρη την είσοδο. Επιπλέον, το Voicebox μπορεί και να επεξεργάζεται κλιπ ήχου, να φιλτράρει το θόρυβο και να διορθώνει ακόμη και λανθασμένες εκφωνήσεις, όπως κάνει δηλαδή η χρήση λογισμικού επεξεργασίας εικόνας για τη βελτίωση φωτογραφιών. Συνολικά, η τεχνητή νοημοσύνη της Meta φέρεται να ξεπερνά κατά πολύ τα Text-to-Speech μοντέλα τελευταίας τεχνολογίας όσον αφορά την ευκρίνεια και την “ηχητική ομοιότητα” και λειτουργεί έως και 20 φορές ταχύτερα.
Ωστόσο, η Meta αποφάσισε να μη διαθέσει προς το παρόν κάποια εφαρμογή ή τον πηγαίο της κώδικα στο κοινό, επικαλούμενη πιθανούς κινδύνους κατάχρησης. Μπορείτε να ακούσετε παραδείγματα και να μάθετε περισσότερα πατώντας εδώ.

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Ο Δυνατός Multi-Band Compact Ασύρματος “Του Αστυνομικού”. Είναι “Τσάμπα” Με 10W με Ρύθμιση μέσω Αpp (bluetooth) και πολλά άλλα Στα 28€ ΚΟΜΠΛΕ! BinTolk BT8200...

Ίσως να είναι ο "Ιδανικός" οικονομικός Ασύρματος για τα Σώματα Ασφαλείας... κι όχι μόνο! Είναι απλά εξαιρετικό για τα χρήματα, όμορφο και πολύ μικρό σε...

Οι επιστήμονες συμφωνούν: Πριν από 600 χρόνια, η αυτοκρατορία των Ίνκας εφηύρε τον πρώτο υπολογιστή

Ερευνητές υποστηρίζουν ότι το «quipu» των Ίνκας λειτουργούσε ως το πρώτο υπολογιστικό σύστημα στον κόσμο. Η πρόοδος της τεχνολογίας έχει οδηγήσει στο να διαθέτουμε σήμερα σύγχρονες συσκευές...

Τα laptop στην ΕΕ θα πρέπει να έχουν κοινή θύρα φόρτισης!

Η Ευρωπαϊκή Ένωση με κοινή οδηγία που τέθηκε σε ισχύ τον Δεκέμβριο του 2024, απαιτούσε από τους κατασκευαστές φορητών συσκευών να υποστηρίζουν φόρτιση με...

Samsung: Έρχεται μεγάλη αναβάθμιση ήχου στα κινητά μέσω Bowers & Wilkins

Η Samsung ετοιμάζει μια ευρεία αναβάθμιση του ηχητικού συστήματος στα μελλοντικά της smartphones, αξιοποιώντας την τεχνογνωσία premium audio brands που εντάχθηκαν πρόσφατα στο χαρτοφυλάκιό...

iPhone 18 Pro: Η μεγαλύτερη αναβάθμιση κάμερας στην ιστορία του iPhone

Ο Mark Gurman του Bloomberg ισχυρίζεται ότι τα iPhone 18 Pro και iPhone 18 Pro Max, που αναμένονται το φθινόπωρο, θα φέρουν τη μεγαλύτερη...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Ο Δυνατός Multi-Band Compact Ασύρματος “Του Αστυνομικού”. Είναι “Τσάμπα” Με 10W με Ρύθμιση μέσω Αpp (bluetooth) και πολλά άλλα Στα 28€ ΚΟΜΠΛΕ! BinTolk BT8200...

Ίσως να είναι ο "Ιδανικός" οικονομικός Ασύρματος για τα Σώματα Ασφαλείας... κι όχι μόνο! Είναι απλά εξαιρετικό για τα χρήματα, όμορφο και πολύ μικρό σε...

Έχεις Makita – DeWalt & Milwaukee? Με Φ64 και Τρελή δύναμη Είναι το Turbo Jet Fan… του μάστορα! Στα 59€ ΚΟΜΠΛΕ! (βίντεο)

Είναι Τέρας Δύναμης... είναι το Turbo Jet Fan... του μάστορα ειδικά φτιαγμένο για να συμπληρώσεις την συλλογή σου. Έχει 3 διαφορετικά μοντέλα Για Makita -...

To “Hayabusa” των πατινιών!? Με 10.000W “Γράφει” 150km/h στο κοντέρ… Ανεβάζεις Αδρεναλίνη! Angwatt T1 MAX στα 1490€ ΚΟΜΠΛΕ (Βίντεο)

Ανεβάζει την Αδρεναλίνη σου στα ύψη... και σίγουρα δεν οδηγείται σαν Πατίνι! Θέλει όμως χέρια, μυαλό γνώση, ωριμότητα, τον απαραίτητο εξοπλισμό και για προσωπική άποψη...

Ανοίγω το Νέο μου Super Tablet 13″ 2,5K με Windows 11, Ai επεξεργαστή Intel Core Ultra 5 115U, 16GB DDR5, 1TB nVme & Επισκευάζω...

Με αφορμή το το Νέο μου Super Tablet 13" 2,5K με Windows 11, Ai επεξεργαστή Intel Core Ultra 5 115U και τα σχόλια πολλών έξυπνων...

Είσαι Camper ή Outdoor τύπος; ΤΕΡΑΣΤΙΑ “Τσάμπα” Σκηνή… Αυτοκινήτου! Xmund car tailgate rear tent στα 71€ ΚΟΜΠΛΕ!!! (βίντεο)

ΠΡΟΣΟΧΗ ΠΟΛΥ ΠΕΡΙΟΡΙΣΜΕΝΗ ΔΙΑΘΕΣΙΜΟΤΗΤΑ Είναι τεράστια, με βολικό factor που θα σε κάνει να εκμεταλλευτείς στο έπακρο τόσο την σκηνή σου όσο και τον χώρο που...