Το Whisper API εγκαινίασε η OpenAI – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

Η εταιρεία πίσω από το ChatGPT, η OpenAI εγκαινίασε σήμερα το Whisper API, μία νέα έκδοση του προγράμματος ανοιχτού κώδικα Whisper που μετατρέπει την ομιλία σε κείμενο.

Με χρέωση 0,006 δολάρια το λεπτό, το Whisper είναι ένα σύστημα αυτόματης αναγνώρισης ομιλίας που επιτρέπει την απομαγνητοφώνηση από πολλές γλώσσες, καθώς και τη μετάφραση από άλλες γλώσσες στα αγγλικά. Δέχεται αρχεία σε διάφορες μορφές, όπως M4A, MP3, MP4, MPEG, MPGA, WAV και WEBM.

Η OpenAI εγκαινίασε το Whisper API  – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

Πολλές εταιρείες έχουν αναπτύξει πολύ ικανά συστήματα αναγνώρισης ομιλίας, τα οποία βρίσκονται στον πυρήνα του λογισμικού και των υπηρεσιών τεχνολογικών κολοσσών όπως η Google, η Amazon και η Meta. «Αυτό όμως που κάνει το Whisper να διαφέρει» είναι ότι εκπαιδεύτηκε σε 680.000 ώρες δεδομένων σε διάφορες γλώσσες, που συλλέχθηκαν από το διαδίκτυο, λέει ο πρόεδρος της OpenAI Γκρεγκ Μπρόκμαν. Κατά τον ίδιο, η διαδικασία της εκμάθησης βελτίωσε την αναγνώριση «ιδιαίτερων προφορών» καθώς και την διάκριση τεχνικών όρων και θορύβων στο παρασκήνιο.

Ο Μπρόκμαν λέει πως η εταιρεία του βελτιστοποίησε το μοντέλο του Whisper φτάνοντας στα όριά του. «Είναι πολύ, πολύ πιο γρήγορο και εξαιρετικά βολικό».

Ωστόσο, το Whisper έχει τους περιορισμούς του – ιδιαίτερα σε ότι αφορά την πρόβλεψη της «επόμενης λέξης». Επειδή το σύστημα εκπαιδεύτηκε σε μεγάλο όγκο δεδομένων με θόρυβο, η OpenAI προειδοποιεί ότι το Whisper ενδέχεται να συμπεριλάβει στις μεταγραφές του λέξεις που δεν έχουν ειπωθεί – πιθανώς επειδή προσπαθεί να προβλέψει την επόμενη λέξη ενώ απομαγνητοφωνεί την ομιλία.

Προς το παρόν το Whisper δεν έχει την ίδια απόδοση σε όλες τις γλώσσες, και το ποσοστό σφαλμάτων είναι υψηλότερο σε γλώσσες για τις οποίες τα δεδομένα της εκμάθησής του ήταν σχετικά λιγότερα.

Η OpenAI θεωρεί πως οι δυνατότητες απομαγνητοφώνησης του Whisper θα βελτιώσουν υφιστάμενες εφαρμογές, προϊόντα και εργαλεία. Ήδη, η εφαρμογή εκμάθησης γλωσσών Speak που υποστηρίζεται από σύστημα τεχνητής νοημοσύνης, χρησιμοποιεί το νέο μοντέλο του Whisper για συζητήσεις με εικονικό συνομιλητή εντός του app.

Εάν η OpenAI καταφέρει να εισέλθει στην αγορά “speech-to-text” (μεταγραφή ομιλίας σε κείμενο), θα μπορούσε να εξασφαλίσει σημαντικά κέρδη. Σύμφωνα με μια έκθεση, η αγορά ενδέχεται να αγγίξει τα 5,4 δισεκατομμύρια δολάρια μέχρι το 2026, από 2,2 δισεκατομμύρια δολάρια που άξιζε το 2021.

«Θέλουμε πραγματικά να γίνουμε αυτή η καθολική νοημοσύνη», δήλωσε ο Μπρόκμαν. «Με μεγάλη ευελιξία, να είμαστε σε θέση να δεχτούμε οποιοδήποτε είδος δεδομένων σας – οποιοδήποτε είδος εργασίας θέλετε να επιτελέσετε – και να λειτουργήσουμε πολλαπλασιαστικά».

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Ένας μαγικός αλλά ψεύτικος κόσμος: Ο αντίκτυπος των AI videos στην παιδική φαντασία

Ξεκινώντας με την επισήμανση ότι αυτή η γενιά που βρίσκεται τώρα στην παιδική ηλικία θα πρέπει να μάθει να ζει με την τεχνητή νοημοσύνη...

Majorana 2: Η Microsoft μας φέρνει πιο κοντά σε κβαντικό υπολογιστή που είναι αξιόπιστος

TL;DR: Η Microsoft προχώρησε στην ανακοίνωση του Majorana 2, ενός νέου κβαντικού chip του οποίου τα qubits είναι 1.000 φορές πιο αξιόπιστα από τον...

Η BYD φτιάχνει ρομπότ — και θα το πουλάει όπως τα αυτοκίνητά της

Η BYD αναπτύσσει δικό της ανθρωποειδές ρομπότ, όπως επιβεβαίωσε η εκτελεστική αντιπρόεδρος του ομίλου Στέλλα Λι (Li Ke) σε τηλεοπτική συνέντευξη. Σύμφωνα με δηλώσεις...

Έρχεται νέο μοντέλο του Nintendo Switch 2 στην Ευρώπη!

Πριν από μερικές εβδομάδες σάς είχαμε ενημερώσει με σχετικό άρθρο για μία φήμη που ήθελε την Nintendo να κυκλοφορεί μια νέα έκδοση του Nintendo...

Xiaomi 18 Pro Max: Δύο κάμερες 200MP σε νέα διαρροή

Νέα διαρροή αποκαλύπτει αναλυτικά τη φωτογραφική διάταξη του Xiaomi 18 Pro Max, που φέρεται να συνδυάζει δύο αισθητήρες 200MP — έναν στην κύρια κάμερα...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Για το “Σακίδιο ΤΩΝ 72 ΩΡΩΝ”… Στα 100 Watt Το “ΜΙΚΡΟΤΕΡΟ Ηλιακό Panel Του ΚΟΣΜΟΥ”!? Τα Πράγματα είναι “ΣΟΒΑΡΑ”… Allpowers SP012 στα 170€ κομπλέ!...

Προσοχή στην Ελλάδα θα βρεις ΜΟΝΟ το Panel στα 500€ και Ψάξτο... Eίναι ίσως το μικρότερο στα 100W ηλιακό πάνελ που υπάρχει και αυτό από...

ΝΟΜΙΜΟΣ Ασύρματος Για ΟΛΟΥΣ! 2 Τεμάχια ΜΑΖΙ… Baofeng T18 PMR446 “ΤΣΑΜΠΑ”… Στα 17€ ΚΟΜΠΛΕ (βίντεο)

Ενημέρωση 31/5 (22:05) Τα πρώτα 50 κουπόνια τελείωσαν δυστυχώς... Σας έχω ενημερώσει πιο κάτω, νέο κουπόνι στην ίδια τιμή. Είναι σε περιορισμένο αριθμό γι'...

Με 3 “ΟΘΟΝΕΣ” κάνει όσα ΔΕΝ ΦΑΝΤΑΖΕΣΑΙ. Ο Lumintop Pixel με Long, Short Throw, Laser, UV είναι είναι εδώ… Στα 92€ ΚΟΜΠΛΕ (βίντεο)

Eίναι ο πιο ιδιαίτερος "πολυφακός" που έχω φέρει στο κανάλι... H ιδιαιτερότητα του δεν του στερεί τίποτα από λειτουργίες και δύναμη με 2 led κοντινής...

Kukirin X1 Mini Dirt Bike. Δοκιμή σε πίστα και Συνέντευξη από 3 φορές Έλληνα Πρωταθλητή Moto Cross! Στα 1124€ ΚΟΜΠΛΕ!!! (2 Βίντεο)

Είναι πραγματικά τόσο "ΑΠΙΘΑΝΑ" ποιοτικό, δυνατό κι όμορφο, όσο και πολύ κοντά στην ΕΛΛΗΝΙΚΗ κατηγορία Mini Cross ΜΧ50. Είναι το Kukirin X1 και είναι ένα...

Power Bank 10000mah από Ελλάδα σε “Τιμή ΚΙΝΑΣ”! Charmast W1056 στα 18€ κομπλέ και Giveaway

Δεν ξέρω αν είναι το καλύτερο, δυνατότερο και ελαφρύτερο... αλλά σίγουρα ξέρω πως είναι σε "Τιμή ΚΙΝΑΣ" και είναι παντού και πάντα χρήσιμο! Βέβαια περί...