Το Whisper API εγκαινίασε η OpenAI – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

8 Μαρτίου 2023

147

Η εταιρεία πίσω από το ChatGPT, η OpenAI εγκαινίασε σήμερα το Whisper API, μία νέα έκδοση του προγράμματος ανοιχτού κώδικα Whisper που μετατρέπει την ομιλία σε κείμενο.

Με χρέωση 0,006 δολάρια το λεπτό, το Whisper είναι ένα σύστημα αυτόματης αναγνώρισης ομιλίας που επιτρέπει την απομαγνητοφώνηση από πολλές γλώσσες, καθώς και τη μετάφραση από άλλες γλώσσες στα αγγλικά. Δέχεται αρχεία σε διάφορες μορφές, όπως M4A, MP3, MP4, MPEG, MPGA, WAV και WEBM.

Η OpenAI εγκαινίασε το Whisper API – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

Πολλές εταιρείες έχουν αναπτύξει πολύ ικανά συστήματα αναγνώρισης ομιλίας, τα οποία βρίσκονται στον πυρήνα του λογισμικού και των υπηρεσιών τεχνολογικών κολοσσών όπως η Google, η Amazon και η Meta. «Αυτό όμως που κάνει το Whisper να διαφέρει» είναι ότι εκπαιδεύτηκε σε 680.000 ώρες δεδομένων σε διάφορες γλώσσες, που συλλέχθηκαν από το διαδίκτυο, λέει ο πρόεδρος της OpenAI Γκρεγκ Μπρόκμαν. Κατά τον ίδιο, η διαδικασία της εκμάθησης βελτίωσε την αναγνώριση «ιδιαίτερων προφορών» καθώς και την διάκριση τεχνικών όρων και θορύβων στο παρασκήνιο.

Ο Μπρόκμαν λέει πως η εταιρεία του βελτιστοποίησε το μοντέλο του Whisper φτάνοντας στα όριά του. «Είναι πολύ, πολύ πιο γρήγορο και εξαιρετικά βολικό».

Ωστόσο, το Whisper έχει τους περιορισμούς του – ιδιαίτερα σε ότι αφορά την πρόβλεψη της «επόμενης λέξης». Επειδή το σύστημα εκπαιδεύτηκε σε μεγάλο όγκο δεδομένων με θόρυβο, η OpenAI προειδοποιεί ότι το Whisper ενδέχεται να συμπεριλάβει στις μεταγραφές του λέξεις που δεν έχουν ειπωθεί – πιθανώς επειδή προσπαθεί να προβλέψει την επόμενη λέξη ενώ απομαγνητοφωνεί την ομιλία.

Προς το παρόν το Whisper δεν έχει την ίδια απόδοση σε όλες τις γλώσσες, και το ποσοστό σφαλμάτων είναι υψηλότερο σε γλώσσες για τις οποίες τα δεδομένα της εκμάθησής του ήταν σχετικά λιγότερα.

Η OpenAI θεωρεί πως οι δυνατότητες απομαγνητοφώνησης του Whisper θα βελτιώσουν υφιστάμενες εφαρμογές, προϊόντα και εργαλεία. Ήδη, η εφαρμογή εκμάθησης γλωσσών Speak που υποστηρίζεται από σύστημα τεχνητής νοημοσύνης, χρησιμοποιεί το νέο μοντέλο του Whisper για συζητήσεις με εικονικό συνομιλητή εντός του app.

Εάν η OpenAI καταφέρει να εισέλθει στην αγορά “speech-to-text” (μεταγραφή ομιλίας σε κείμενο), θα μπορούσε να εξασφαλίσει σημαντικά κέρδη. Σύμφωνα με μια έκθεση, η αγορά ενδέχεται να αγγίξει τα 5,4 δισεκατομμύρια δολάρια μέχρι το 2026, από 2,2 δισεκατομμύρια δολάρια που άξιζε το 2021.

«Θέλουμε πραγματικά να γίνουμε αυτή η καθολική νοημοσύνη», δήλωσε ο Μπρόκμαν. «Με μεγάλη ευελιξία, να είμαστε σε θέση να δεχτούμε οποιοδήποτε είδος δεδομένων σας – οποιοδήποτε είδος εργασίας θέλετε να επιτελέσετε – και να λειτουργήσουμε πολλαπλασιαστικά».

ΠΗΓΗ

Προηγούμενο άρθρο

Μία RDNA2 GPU διαθέτουν οι AMD Ryzen 7000 Series επεξεργαστές που υπερχρονίζεται σε… ακραίο σημείο

Επόμενο άρθρο

Έτσι θα είναι οι νέοι υπολογιστές iMac της Apple

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Το Whisper API εγκαινίασε η OpenAI – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

Ένας μαγικός αλλά ψεύτικος κόσμος: Ο αντίκτυπος των AI videos στην παιδική φαντασία

Majorana 2: Η Microsoft μας φέρνει πιο κοντά σε κβαντικό υπολογιστή που είναι αξιόπιστος

Η BYD φτιάχνει ρομπότ — και θα το πουλάει όπως τα αυτοκίνητά της

Leave a reply Ακύρωση απάντησης

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Ένας μαγικός αλλά ψεύτικος κόσμος: Ο αντίκτυπος των AI videos στην παιδική φαντασία

Majorana 2: Η Microsoft μας φέρνει πιο κοντά σε κβαντικό υπολογιστή που είναι αξιόπιστος

Η BYD φτιάχνει ρομπότ — και θα το πουλάει όπως τα αυτοκίνητά της

Έρχεται νέο μοντέλο του Nintendo Switch 2 στην Ευρώπη!

Xiaomi 18 Pro Max: Δύο κάμερες 200MP σε νέα διαρροή

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Για το “Σακίδιο ΤΩΝ 72 ΩΡΩΝ”… Στα 100 Watt Το “ΜΙΚΡΟΤΕΡΟ Ηλιακό Panel Του ΚΟΣΜΟΥ”!? Τα Πράγματα είναι “ΣΟΒΑΡΑ”… Allpowers SP012 στα 170€ κομπλέ!...

ΝΟΜΙΜΟΣ Ασύρματος Για ΟΛΟΥΣ! 2 Τεμάχια ΜΑΖΙ… Baofeng T18 PMR446 “ΤΣΑΜΠΑ”… Στα 17€ ΚΟΜΠΛΕ (βίντεο)

Με 3 “ΟΘΟΝΕΣ” κάνει όσα ΔΕΝ ΦΑΝΤΑΖΕΣΑΙ. Ο Lumintop Pixel με Long, Short Throw, Laser, UV είναι είναι εδώ… Στα 92€ ΚΟΜΠΛΕ (βίντεο)

Kukirin X1 Mini Dirt Bike. Δοκιμή σε πίστα και Συνέντευξη από 3 φορές Έλληνα Πρωταθλητή Moto Cross! Στα 1124€ ΚΟΜΠΛΕ!!! (2 Βίντεο)

Power Bank 10000mah από Ελλάδα σε “Τιμή ΚΙΝΑΣ”! Charmast W1056 στα 18€ κομπλέ και Giveaway

ΣΧΕΤΙΚΑ ΜΕ ΕΜΑΣ

ΕΓΓΡΑΦΗ ΣΤΟ NEWSLETTER ΜΑΣ

ΑΚΟΛΟΥΘΗΣΤΕ ΜΑΣ ΣΤΑ SOCIAL