13.2 C
Athens
Τετάρτη, 1 Απριλίου 2026

Το Whisper API εγκαινίασε η OpenAI – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

Η εταιρεία πίσω από το ChatGPT, η OpenAI εγκαινίασε σήμερα το Whisper API, μία νέα έκδοση του προγράμματος ανοιχτού κώδικα Whisper που μετατρέπει την ομιλία σε κείμενο.

Με χρέωση 0,006 δολάρια το λεπτό, το Whisper είναι ένα σύστημα αυτόματης αναγνώρισης ομιλίας που επιτρέπει την απομαγνητοφώνηση από πολλές γλώσσες, καθώς και τη μετάφραση από άλλες γλώσσες στα αγγλικά. Δέχεται αρχεία σε διάφορες μορφές, όπως M4A, MP3, MP4, MPEG, MPGA, WAV και WEBM.

Η OpenAI εγκαινίασε το Whisper API  – Γράφει όσα λέμε και μεταφράζει στα αγγλικά

Πολλές εταιρείες έχουν αναπτύξει πολύ ικανά συστήματα αναγνώρισης ομιλίας, τα οποία βρίσκονται στον πυρήνα του λογισμικού και των υπηρεσιών τεχνολογικών κολοσσών όπως η Google, η Amazon και η Meta. «Αυτό όμως που κάνει το Whisper να διαφέρει» είναι ότι εκπαιδεύτηκε σε 680.000 ώρες δεδομένων σε διάφορες γλώσσες, που συλλέχθηκαν από το διαδίκτυο, λέει ο πρόεδρος της OpenAI Γκρεγκ Μπρόκμαν. Κατά τον ίδιο, η διαδικασία της εκμάθησης βελτίωσε την αναγνώριση «ιδιαίτερων προφορών» καθώς και την διάκριση τεχνικών όρων και θορύβων στο παρασκήνιο.

Ο Μπρόκμαν λέει πως η εταιρεία του βελτιστοποίησε το μοντέλο του Whisper φτάνοντας στα όριά του. «Είναι πολύ, πολύ πιο γρήγορο και εξαιρετικά βολικό».

Ωστόσο, το Whisper έχει τους περιορισμούς του – ιδιαίτερα σε ότι αφορά την πρόβλεψη της «επόμενης λέξης». Επειδή το σύστημα εκπαιδεύτηκε σε μεγάλο όγκο δεδομένων με θόρυβο, η OpenAI προειδοποιεί ότι το Whisper ενδέχεται να συμπεριλάβει στις μεταγραφές του λέξεις που δεν έχουν ειπωθεί – πιθανώς επειδή προσπαθεί να προβλέψει την επόμενη λέξη ενώ απομαγνητοφωνεί την ομιλία.

Προς το παρόν το Whisper δεν έχει την ίδια απόδοση σε όλες τις γλώσσες, και το ποσοστό σφαλμάτων είναι υψηλότερο σε γλώσσες για τις οποίες τα δεδομένα της εκμάθησής του ήταν σχετικά λιγότερα.

Η OpenAI θεωρεί πως οι δυνατότητες απομαγνητοφώνησης του Whisper θα βελτιώσουν υφιστάμενες εφαρμογές, προϊόντα και εργαλεία. Ήδη, η εφαρμογή εκμάθησης γλωσσών Speak που υποστηρίζεται από σύστημα τεχνητής νοημοσύνης, χρησιμοποιεί το νέο μοντέλο του Whisper για συζητήσεις με εικονικό συνομιλητή εντός του app.

Εάν η OpenAI καταφέρει να εισέλθει στην αγορά “speech-to-text” (μεταγραφή ομιλίας σε κείμενο), θα μπορούσε να εξασφαλίσει σημαντικά κέρδη. Σύμφωνα με μια έκθεση, η αγορά ενδέχεται να αγγίξει τα 5,4 δισεκατομμύρια δολάρια μέχρι το 2026, από 2,2 δισεκατομμύρια δολάρια που άξιζε το 2021.

«Θέλουμε πραγματικά να γίνουμε αυτή η καθολική νοημοσύνη», δήλωσε ο Μπρόκμαν. «Με μεγάλη ευελιξία, να είμαστε σε θέση να δεχτούμε οποιοδήποτε είδος δεδομένων σας – οποιοδήποτε είδος εργασίας θέλετε να επιτελέσετε – και να λειτουργήσουμε πολλαπλασιαστικά».

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

AirPods χωρίς θήκη: μια συνήθεια που κοστίζει

Τα AirPods είναι ίσως το πιο εύκολο προϊόν να ξεχάσεις να προστατέψεις. Τα βάζεις στην τσέπη, στη τσάντα, στο τραπέζι, στο κομοδίνο. Ταξιδεύουν μαζί...

Αναδιπλούμενο iPhone: Η «σημαντικότερη ανανέωση» όλων των εποχών

H Apple ετοιμάζει, σύμφωνα με τον δημοσιογράφο του Bloomberg Mark Gurman, «την πιο σημαντική ανανέωση στην ιστορία του iPhone» — ένα αναδιπλούμενο μοντέλο που...

Instagram Plus: Ήρθαν οι συνδρομές με νέα χαρακτηριστικά

Η Meta μόλις ανακοίνωσε το Instagram Plus, το νέο συνδρομητικό πακέτο της πλατφόρμας, το οποίο έφτασε ήδη στις πρώτες αγορές. Χρήστες αναφέρουν πως το...

realme: Όλες οι επισκευές και η υποστήριξη περνούν στην OPPO από 1 Απριλίου

Η realme ενσωματώνεται πλήρως στο after-sales δίκτυο της OPPO από 1 Απριλίου 2026, με επισκευές, υποστήριξη, mall και κοινότητα να περνούν στο οικοσύστημα της...

Android TV: Πώς να κάνεις την τηλεόρασή σου πιο γρήγορη με 2 απλές ρυθμίσεις

Οι Android TV χάνουν τις επιδόσεις τους όσο περνά ο καιρός, γεμίζει ο αποθηκευτικός χώρος και αυξάνονται οι εγκατεστημένες εφαρμογές. Σε αυτό το περιβάλλον,...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

Ο “Διαστημικός” Astrolux K3, είναι Ιδιαίτερος και κάνει τα ΠΑΝΤΑ… Στα 44€ ΚΟΜΠΛΕ (βίντεο)

Ίσως είναι ο πιο ιδιαίτερος φακός που έχω φέρει στο κανάλι... Ο διαστημικός του σχεδιασμός και η ιδιαιτερότητα του δεν του στερούν τίποτα από λειτουργίες...

Ο Νέος μου Τυφώνας… Απογειώνει και Σκάβει με τη ΔΥΝΑΜΗ του ΑΕΡΑ!? Στα 77€ ΚΟΜΠΛΕ!!! Foursun LB1

Είναι Τέρας Δύναμης... είναι Leaf Blower ή Φυσητήρας αέρα και πλέον δεν είναι Μόνο για μια χρήση μπορείς να κάνεις πολλά κι απίστευτα! Τα νούμερα...

Best Seler και To “ΑΠΟΛΥΤΟ” ηχείο Bluetooth στα 25€ Από Ελλάδα. Με 40Watt QCY SP7 (Βιντεο & Giveaway)

Είναι και ήταν Top Seler όταν η τιμή του ήταν 10€ πάνω από την σημερινή! Γι' αυτό τα χτυπάς δυο - δυο και το...

Επαγγελματίας ή Gamer με “Σφιχτό Badget”? To πιο ΗΟΤ “Όμορφο” VFM 27άρι, 2Κ με 200hz… Στα 159€ ΚΟΜΠΛΕ. (Βίντεο)

Για να κόψεις τιμολόγιο μετά  την ολοκλήρωση της παραγγελίας σου στείλε email με τα στοιχεία σου, τον αριθμό παραγγελίας και την ένδειξη "Busines Invoice"...

Η Smart Κλειδαριά του “Σπιτιού Μου” με Φυσικό Κλειδί για την “Δύσκολη… και με 4 Smart Τρόπους Ανοίγματος. Στα 189€ Κομπλέ Welock U81

Ήρθε η ώρα να μπει η κατάλληλη Welock και στο δικό μου σπίτι (στο γραφείο μου με συντροφεύει και με βοηθά καιρό τώρα)... Υπάρχουν...