Είμαστε πιο κοντά από ποτέ στην «αθανασία» μέσω AI χάρη στη νέα τεχνολογία φωνής της Meta

Οι ραγδαίες εξελίξεις στο χώρο της τεχνητής νοημοσύνης συνεχίζονται και τώρα η Meta έκανε ένα σημαντικό βήμα προς την «αθανασία» μέσω AI, με την παρουσίαση του Voicebox, ενός εξελιγμένου μοντέλου παραγωγής φωνής από κείμενο. Αυτή η νέα τεχνητή νοημοσύνη φιλοδοξεί να κάνει ότι κατάφερε το ChatGPT για το κείμενο και το Dall-E για τη δημιουργία εικόνων, παράγοντας τρομερά ρεαλιστικά ηχητικά αποσπάσματα από κείμενο. Θεωρητικά, με το Voicebox, η φωνή οποιοδήποτε διάσημου και όχι μόνο θα μπορούσε να συνεχίσει να χρησιμοποιείται ακόμη και μετά το θάνατό του.
Σύμφωνα με τη Meta, το Voicebox λειτουργεί ως ένα “non-autoregressive flow-matching” μοντέλο που έχει εκπαιδευτεί για να συμπληρώνει την ομιλία, δεδομένου του ηχητικού πλαισίου και του κειμένου. Η τεχνητή νοημοσύνη εκπαιδεύτηκε με περισσότερες από 50.000 ώρες δεδομένων ήχου από δημόσια προσβάσιμα audiobooks σε διάφορες γλώσσες, συμπεριλαμβανομένων των αγγλικών, γαλλικών, ισπανικών, γερμανικών, πολωνικών και πορτογαλικών. Αυτό το πλούσιο και ποικιλόμορφο σύνολο δεδομένων επιτρέπει στο Voicebox να δημιουργεί ομιλία που ακούγεται σαν πραγματική, ανεξάρτητα από τη γλώσσα. Μάλιστα, το εντυπωσιακό είναι ότι η συνθετική ομιλία που παράγεται από το Voicebox είχε ποσοστό σφάλματος μόνο 1%, μια σημαντική βελτίωση σε σύγκριση με την κατά 45 έως 70% εξασθένιση που παρατηρείται στα υπάρχοντα μοντέλα μετατροπής κειμένου σε ομιλία (TTS).Είμαστε πιο κοντά από ποτέ στην «αθανασία» μέσω AI χάρη στη νέα τεχνολογία φωνής της MetaΗ καινοτόμος διαδικασία εκπαίδευσης περιλάμβανε μεταξύ άλλων τη δυνατότητα του μοντέλου να προβλέπει τμήματα ομιλίας με βάση το περιβάλλον και το σχετικό κείμενο. Όπως περιγράφουν οι ερευνητές της Meta, αυτό επιτρέπει στο μοντέλο να παράγει συγκεκριμένα τμήματα μιας ηχογράφησης, χωρίς να αναδημιουργεί ολόκληρη την είσοδο. Επιπλέον, το Voicebox μπορεί και να επεξεργάζεται κλιπ ήχου, να φιλτράρει το θόρυβο και να διορθώνει ακόμη και λανθασμένες εκφωνήσεις, όπως κάνει δηλαδή η χρήση λογισμικού επεξεργασίας εικόνας για τη βελτίωση φωτογραφιών. Συνολικά, η τεχνητή νοημοσύνη της Meta φέρεται να ξεπερνά κατά πολύ τα Text-to-Speech μοντέλα τελευταίας τεχνολογίας όσον αφορά την ευκρίνεια και την “ηχητική ομοιότητα” και λειτουργεί έως και 20 φορές ταχύτερα.
Ωστόσο, η Meta αποφάσισε να μη διαθέσει προς το παρόν κάποια εφαρμογή ή τον πηγαίο της κώδικα στο κοινό, επικαλούμενη πιθανούς κινδύνους κατάχρησης. Μπορείτε να ακούσετε παραδείγματα και να μάθετε περισσότερα πατώντας εδώ.

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Οι επόμενοι AMD επεξεργαστές, θα ξεφύγουν…

Η AMD φαίνεται πως έχει ήδη ξεκινήσει την προετοιμασία για την επόμενη μεγάλη γενιά των x86 επεξεργαστών της, με την αρχιτεκτονική Zen 7 να...

Samsung και Google αλλάζουν το παιχνίδι στα Smart Glasses με Android XR και Gemini!

Η Samsung μας μιλάει για έξυπνα γυαλιά εδώ και χρόνια, την ώρα που η Meta πουλάει Ray-Ban σαν… ζεστά κουλούρια. Μέχρι σήμερα τα λόγια...

AI: Είναι πολύ εύκολο να δώσει τον αριθμό του κινητού σου

Όπως έχουν προειδοποιήσει διάφορες πλευρές, από τότε που έκαναν την εμφάνισή τους τα διάφορα chatbots, ποτέ δεν θα πρέπει να πιστεύουμε ή να θεωρήσουμε...

Τα flagships Xiaomi ακριβαίνουν — και το Xiaomi 17 Ultra στην Ελλάδα κάνει ήδη 1.499 ευρώ

Τα κορυφαία Android smartphones κινούνται ταχύτατα προς νέα υψηλά στις τιμές και η Xiaomi είναι η πρώτη μεγάλη εταιρεία που βάζει αριθμούς στο τραπέζι....

iOS 27 Siri: Dark theme, chat και νέα αναζήτηση — διέρρευσαν τα πάντα

Ο γνωστός αναλυτής του Bloomberg Mark Gurman αποκάλυψε χθες νέες λεπτομέρειες για το πώς θα μοιάζει και πώς θα λειτουργεί η ανανεωμένη Siri στο...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Kukirin X1 Mini Dirt Bike. Δοκιμή σε πίστα και Συνέντευξη από 3 φορές Έλληνα Πρωταθλητή Moto Cross! Στα 1124€ ΚΟΜΠΛΕ!!! (2 Βίντεο)

Είναι πραγματικά τόσο "ΑΠΙΘΑΝΑ" ποιοτικό, δυνατό κι όμορφο, όσο και πολύ κοντά στην ΕΛΛΗΝΙΚΗ κατηγορία Mini Cross ΜΧ50. Είναι το Kukirin X1 και είναι ένα...

Power Bank 10000mah από Ελλάδα σε “Τιμή ΚΙΝΑΣ”! Charmast W1056 στα 18€ κομπλέ και Giveaway

Δεν ξέρω αν είναι το καλύτερο, δυνατότερο και ελαφρύτερο... αλλά σίγουρα ξέρω πως είναι σε "Τιμή ΚΙΝΑΣ" και είναι παντού και πάντα χρήσιμο! Βέβαια περί...

Το Πιο FULL & “ΨΑΓΜΕΝΟ” Επώνυμο με ΚΑΘΙΣΜΑ και 2πλο Κουπί SUP (Stand Up Paddle). Είναι “Μεγάλο” με 3,5m μήκος & 180+ Κιλά Load…...

Ένα πραγματικό όνειρο για πολλούς και πολλές από εμάς... Ένα FULL & "ΨΑΓΜΕΝΟ" Επώνυμο με ΚΑΘΙΣΜΑ και 2πλο Κουπί SUP που παρακαλούσαμε να βρούμε...

2 Φθηνά, επώνυμα και χρήσιμα “Για ‘Μένα”! Super Mini Κομπρεσεράκι Popdeer και Premium Jet Fan Foursun (Video)

Είναι χρήσιμα, πολύ ποιοτικά, ιδιαίτερα το καθένα με τον "δικό του" τρόπο κι έχουν έρθει για προσωπική χρήση. Είναι και τα 2 από Ευρώπη και...

Από Ελλάδα Ηλιακό Πάνελ 80Watt σε ΤΙΜΗ “Κίνας”! Ο Απόλυτος Φίλος του καλοκαιριού… Στα 89€ Κομπλέ Cheotech SC007 (Video)

Η τιμή για την ποιότητα του είναι Κίνας κι όχι Ελλάδας Ήρθε την πιο κατάλληλη στιγμή αν και στην χώρα μας θεωρώ πως ότι ηλιακό...