Μετάβαση στο περιεχόμενο
25.6 C
Athens
Πέμπτη, 5 Ιουνίου 2025

Ο υπερυπολογιστής Eos της NVIDIA έσπασε το δικό του ρεκόρ εκπαίδευσης AI

Η εκπαίδευση ενός μεγάλου γλωσσικού μοντέλου μπορεί να διαρκέσει εβδομάδες, μήνες, ακόμη και χρόνια για να ολοκληρωθεί ανάλογα με το hardware. Γι’ αυτό και όταν επιτυγχάνεται σπουδαία πρόοδος, είναι κάτι αξιοσημείωτο.

Την Τετάρτη, η NVIDIA παρουσίασε την πιο πρόσφατη έκδοση του υπερυπολογιστή της Eos, ο οποίος τροφοδοτείται από περισσότερες από 10.000 H100 Tensor Core GPUs και είναι σε θέση να εκπαιδεύσει ένα μοντέλο GPT-3 με 175 δισεκατομμύρια παραμέτρους σε 1 δισεκατομμύριο τοκενς σε λιγότερο από τέσσερα λεπτά. Αυτό είναι τρεις φορές πιο γρήγορο από το προηγούμενο ρεκόρ στον βιομηχανικό πρότυπο της AI MLPerf, το οποίο η NVIDIA είχε πετύχει μόλις πριν από έξι μήνες.

Το Eos χρησιμοποιεί 10.752 GPUs που συνδέονται με το δίκτυο Infiniband της NVIDIA και 860 τεραμπάιτ υψηλής ταχύτητας μνήμης για να παρέχει 40 exaflops υπολογιστική ισχύ AI. Η συνολική αρχιτεκτονική στο cloud αποτελείται από 1344 κόμβους – ατομικούς διακομιστές στους οποίους οι εταιρείες μπορούν να ενοικιάσουν πρόσβαση για περίπου $37.000 τον μήνα για την επέκταση των δυνατοτήτων τους στην τεχνητή νοημοσύνη χωρίς να χρειάζεται να δημιουργήσουν τη δική τους υποδομή.

Συνολικά, η NVIDIA έκανε έξι ρεκόρ σε εννέα δοκιμές benchmark: με 3,9 λεπτά για το GPT-3, 2,5 λεπτά για να εκπαιδευτεί ένα μοντέλο Stable Diffusion χρησιμοποιώντας 1.024 Hopper GPUs, 1 λεπτό για το DLRM, 55,2 δευτερόλεπτα για το RetinaNet, 46 δευτερόλεπτα για το 3D U-Net και μόλις 7,2 δευτερόλεπτα για το μοντέλο BERT-Large.

Η NVIDIA έσπευσε να σημειώσει ότι η έκδοση 175 δισεκατομμυρίων παραμέτρων του GPT-3 που χρησιμοποιήθηκε στη συγκριτική αξιολόγηση δεν είναι η επανάληψη πλήρους μεγέθους του μοντέλου (ούτε το μοντέλο Stable Diffusion). Το μεγαλύτερο GPT-3 προσφέρει περίπου 3,7 τρισεκατομμύρια παραμέτρους και είναι απλά πολύ μεγάλο και δυσκίνητο για χρήση σε δοκιμή συγκριτικής αξιολόγησης. Για παράδειγμα, θα χρειαζόταν 18 μήνες για να το εκπαιδεύσετε στο παλαιότερο σύστημα A100 με 512 GPU αλλά το Eos χρειάζεται μόλις οκτώ ημέρες.

Αντίθετα, η NVIDIA και η MLCommons, η οποία διαχειρίζεται το πρότυπο MLPerf, αξιοποιούν μια πιο συμπαγή έκδοση που χρησιμοποιεί 1 δισεκατομμύριο tokens (η μικρότερη μονάδα παρονομαστή δεδομένων που κατανοούν τα συστήματα παραγωγής τεχνητής νοημοσύνης).

Η NVIDIA εστιάζει συνεχώς στις δυνατότητες και τις εφαρμογές της AI τους τελευταίους μήνες. «Βρισκόμαστε στη στιγμή του iPhone για την τεχνητή νοημοσύνη», δήλωσε ο διευθύνων σύμβουλος Jensen Huang κατά τη διάρκεια της κεντρικής ομιλίας του στο GTC τον Μάρτιο. Εκείνη την εποχή, η εταιρεία ανακοίνωσε το σύστημα cloud DGX της, το οποίο κατανέμει κομμάτια της επεξεργαστικής ισχύος του υπερυπολογιστή — συγκεκριμένα με οκτώ τσιπ H100 ή A100 με 60 GB VRAM (640 μνήμη συνολικά). Η εταιρεία επέκτεινε το χαρτοφυλάκιο υπερυπολογιστών της με την κυκλοφορία του DGX GH200 στην Computex τον Μάιο.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Η Microsoft υπόσχεται το τέλος της σύγχυσης με τις θύρες USB-C στα Windows 11

H Microsoft υπόσχεται να τερματίσει τη σύγχυση με τις θύρες USB-C μέσω του ενημερωμένου προγράμματος Windows Hardware Compatibility Program (WHCP) για τα Windows 11. Σύμφωνα...

Huawei Pura 80 series: Θα έχουν επίσημη ανακοίνωση και μάθαμε πότε

Η Huawei θα ανακοινώσει τα Huawei Pura 80 series στις 11 Ιουνίου στην Κίνα, σύμφωνα με ανάρτηση της εταιρείας σήμερα. Είναι η πρώτη φορά...

Android Auto: To Google Maps γίνεται πιο έξυπνο και χρησιμοποιεί περισσότερες οθόνες στο όχημα!

Πόσες οθόνες έχεις γύρω σου αυτή τη στιγμή; Από την τηλεόραση, την οθόνη του κινητού σου, του tablet σου και την τηλεόρασή σου. Περιβαλλόμαστε...

ZTE Blade A76: Επίσημο το οικονομικό smartphone με κάμερα 50 MP

Η ZTE παρουσιάζει ένα νέο smartphone της σειράς Blade, το Blade A76, μια οικονομική συσκευή που αναφέρεται στην επίσημη σελίδα της μάρκας στη Βουλγαρία...

Samsung Galaxy Fold7 Ultra: Νέο teaser επιβεβαιώνει ότι έρχεται

Η Samsung φημολογείται εδώ και αρκετό καιρό ότι θα φέρει μια έκδοση Ultra στη σειρά Fold και τώρα έχουμε το πρώτο επίσημο teaser για...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

ΠΡΕΠΕΙ να ΥΠΑΡΧΕΙ σε κάθε Σπίτι… & ΜΕ 83€ ΚΟΜΠΛΕ;;; ΜΠΟΡΕΙ… Το πιο VFM Spot Cleaner ΥΓΡΩΝ & ΣΤΕΡΕΩΝ Teendow C5

Πραγματικά μετά την "συμβίωση" μαζί του όχι μόνο της δικής μου μου οικογένειας και σπιτιού αλλά και της αδερφής μου το συμπέρασμα είναι ένα... Είναι...

“Διαστημικό” BT Ηχείο Σε Διαστημική τιμή από Ελλάδα… 18,44€ ΚΟΜΠΛΕ… και το 2 ΔΩΡΟ του Project 15 Εβδομάδες, 15 ΔΩΡΑ για εσάς!

Απίθανη τιμή πραγματικά "διαστημική ποιότητα" για την τιμή του που ρίχνει σαγόνια χωρίς ο ήχος του να σε αφήνει αδιάφορο... Είναι όμορφο, ποιοτικό, τσάμπα κι...

3η Γενιά και ΝΕΟ BEST SELLER… Google Certified Xiaomi mi Box S 3d Gen, O Νέος “Βασιλιάς” και “λόγο τιμής” Στα 55€ ΚΟΜΠΛΕ

Αν θέλεις να κάνεις την παλιά χαζή σου τηλεόραση Smart, ή να μετατρέψεις το παλιό ξεχασμένο πεταμένο σου μόνιτορ την Super smart TV, ή...

“Recci W36″… ΚΑΙ… Πάμε Για 100άρα… ΕΥΧΑΡΙΣΤΩ με 15 ΔΩΡΑ (Giveaways) για 15 ΕΒΔΟΜΑΔΕΣ… Παρέα με το kimstore.gr και 20% ΕΚΠΤΩΣΗ σε “ΟΛΑ”…

Από που να ξεκινήσω, από το ΤΕΡΑΣΤΙΟ ΕΥΧΑΡΙΣΤΩ για την Εμπιστoσύνη, την στήριξη και την αγάπη από όλους σας στο κανάλι.... Από το ΠΟΛΥ μεγάλο...

Από Άλλο πλανήτη… Εσπρεσιέρα με δική της “Αφρογαλιέρα” απλά και καθαρά… Γίνε Barista στο Σπίτι σου! Στα 165€ κομπλέ Hibrew H13A

ΑΠΛΑ... Βάλε τον δικό σου αρωματικό αλεσμένο καφέ, επέλεξε ανάμεσα σε Μονό ή 2πλό Capuchino, Late ή και Espresso κι άσε το "εργαλείο" σου...