Μετάβαση στο περιεχόμενο
35.9 C
Athens
Πέμπτη, 26 Ιουνίου 2025

Ο υπερυπολογιστής Eos της NVIDIA έσπασε το δικό του ρεκόρ εκπαίδευσης AI

Η εκπαίδευση ενός μεγάλου γλωσσικού μοντέλου μπορεί να διαρκέσει εβδομάδες, μήνες, ακόμη και χρόνια για να ολοκληρωθεί ανάλογα με το hardware. Γι’ αυτό και όταν επιτυγχάνεται σπουδαία πρόοδος, είναι κάτι αξιοσημείωτο.

Την Τετάρτη, η NVIDIA παρουσίασε την πιο πρόσφατη έκδοση του υπερυπολογιστή της Eos, ο οποίος τροφοδοτείται από περισσότερες από 10.000 H100 Tensor Core GPUs και είναι σε θέση να εκπαιδεύσει ένα μοντέλο GPT-3 με 175 δισεκατομμύρια παραμέτρους σε 1 δισεκατομμύριο τοκενς σε λιγότερο από τέσσερα λεπτά. Αυτό είναι τρεις φορές πιο γρήγορο από το προηγούμενο ρεκόρ στον βιομηχανικό πρότυπο της AI MLPerf, το οποίο η NVIDIA είχε πετύχει μόλις πριν από έξι μήνες.

Το Eos χρησιμοποιεί 10.752 GPUs που συνδέονται με το δίκτυο Infiniband της NVIDIA και 860 τεραμπάιτ υψηλής ταχύτητας μνήμης για να παρέχει 40 exaflops υπολογιστική ισχύ AI. Η συνολική αρχιτεκτονική στο cloud αποτελείται από 1344 κόμβους – ατομικούς διακομιστές στους οποίους οι εταιρείες μπορούν να ενοικιάσουν πρόσβαση για περίπου $37.000 τον μήνα για την επέκταση των δυνατοτήτων τους στην τεχνητή νοημοσύνη χωρίς να χρειάζεται να δημιουργήσουν τη δική τους υποδομή.

Συνολικά, η NVIDIA έκανε έξι ρεκόρ σε εννέα δοκιμές benchmark: με 3,9 λεπτά για το GPT-3, 2,5 λεπτά για να εκπαιδευτεί ένα μοντέλο Stable Diffusion χρησιμοποιώντας 1.024 Hopper GPUs, 1 λεπτό για το DLRM, 55,2 δευτερόλεπτα για το RetinaNet, 46 δευτερόλεπτα για το 3D U-Net και μόλις 7,2 δευτερόλεπτα για το μοντέλο BERT-Large.

Η NVIDIA έσπευσε να σημειώσει ότι η έκδοση 175 δισεκατομμυρίων παραμέτρων του GPT-3 που χρησιμοποιήθηκε στη συγκριτική αξιολόγηση δεν είναι η επανάληψη πλήρους μεγέθους του μοντέλου (ούτε το μοντέλο Stable Diffusion). Το μεγαλύτερο GPT-3 προσφέρει περίπου 3,7 τρισεκατομμύρια παραμέτρους και είναι απλά πολύ μεγάλο και δυσκίνητο για χρήση σε δοκιμή συγκριτικής αξιολόγησης. Για παράδειγμα, θα χρειαζόταν 18 μήνες για να το εκπαιδεύσετε στο παλαιότερο σύστημα A100 με 512 GPU αλλά το Eos χρειάζεται μόλις οκτώ ημέρες.

Αντίθετα, η NVIDIA και η MLCommons, η οποία διαχειρίζεται το πρότυπο MLPerf, αξιοποιούν μια πιο συμπαγή έκδοση που χρησιμοποιεί 1 δισεκατομμύριο tokens (η μικρότερη μονάδα παρονομαστή δεδομένων που κατανοούν τα συστήματα παραγωγής τεχνητής νοημοσύνης).

Η NVIDIA εστιάζει συνεχώς στις δυνατότητες και τις εφαρμογές της AI τους τελευταίους μήνες. «Βρισκόμαστε στη στιγμή του iPhone για την τεχνητή νοημοσύνη», δήλωσε ο διευθύνων σύμβουλος Jensen Huang κατά τη διάρκεια της κεντρικής ομιλίας του στο GTC τον Μάρτιο. Εκείνη την εποχή, η εταιρεία ανακοίνωσε το σύστημα cloud DGX της, το οποίο κατανέμει κομμάτια της επεξεργαστικής ισχύος του υπερυπολογιστή — συγκεκριμένα με οκτώ τσιπ H100 ή A100 με 60 GB VRAM (640 μνήμη συνολικά). Η εταιρεία επέκτεινε το χαρτοφυλάκιο υπερυπολογιστών της με την κυκλοφορία του DGX GH200 στην Computex τον Μάιο.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

Το iPhone στη μεγαλύτερη αλλαγή στα χρονικά! Το νέο design

Λίγοι μήνες έμειναν μέχρι η Apple να παρουσιάσει τη νέα οικογένεια των iPhone 17, ωστόσο πηγές της βιομηχανίας μιλούν ήδη για ένα χρονοδιάγραμμα τριών...

Η Microsoft αναβιώνει τον κλασικό MS-DOS Editor ως εφαρμογή ανοιχτού κώδικα για όλες τις πλατφόρμες

Η Microsoft κυκλοφόρησε μια σύγχρονη έκδοση του κλασικού MS-DOS Editor, φέρνοντας πίσω ένα κομμάτι της υπολογιστικής ιστορίας που πρωτοεμφανίστηκε στο MS-DOS 5.0 το 1991. Το...

GeForce RTX 5050: Ανακοινώθηκε με 2560 CUDA Cores και τιμή στα $249

Η Nvidia προχώρησε στην ανακοίνωση της Nvidia GeForce RTX 5050 για σταθερούς υπολογιστές, με την κάρτα να έχει ανέβει ήδη στη σελίδα της εταιρείας...

Samsung Galaxy Z Fold7: Διέρρευσε ξανά και στα τρία χρώματα

Τα foldable τηλέφωνα Galaxy της Samsung συνεχίζουν να διαρρέουν ενόψει της κυκλοφορίας τους στις 9 Ιουλίου και η τελευταία πληροφορία προέρχεται από τον Evan...

Google Pixel 10: Τα τελευταία leak προκαλούν πολλά ερωτήματα

Η Google έχει διανύσει μεγάλη απόσταση τα τελευταία χρόνια, εξελίσσοντας τα τηλέφωνά της ώστε να ανταγωνίζονται σοβαρά κολοσσούς της βιομηχανίας όπως η Samsung και...

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

“Συλλεκτικά”… PubG Helmet… Ακουστικά! Σε τιμή και Ποιότητα που δεν Πονάει… Τσέπη & Αφτιά? Στα 23,9€ από Ελλάδα & Giveaway

Νομίζω πως ο τίτλος περιγράφει τα μισά από όσα θέλω να πω... Πάντως είτε είσαι Gamer είτε όχι νομίζω ότι κι εσύ είχες καιρό να...

Κάνε Γυαλί, το Αυτοκίνητο σου ΧΩΡΙΣ σπατάλη ΝΕΡΟΥ… Η λύσεις είναι εδώ και είναι “SUPER”

Καλοκαιράκι και η χαρά του "παιδιού" να πλένει, να περιποιείται και να καθαρίζει το αυτοκίνητο του μιας και οι βροχές και οι λάσπες του...

Ο Νέος μου Τυφώνας… “ΤΣΕΠΗΣ”… Σκάβει… με τη ΔΥΝΑΜΗ του ΑΕΡΑ!? Στα 19€ ΚΟΜΠΛΕ!!! Fiizreal Χ5

Είναι μικρά είναι πολύ δυνατά... είναι τα πλέον πολύ γνωστά σε όλους μας Turbo ή Jet Fan's και πλέον μπορείς να τα αποκτήσεις πάρα...

Χτυπάς ΧΘΕΣ… Το Super Ψυγείο της Mudiro που Φτιάχνει και Παγάκια στα 271€ ΚΟΜΠΛΕ Από Ευρώπη

ΔΕΝ ΘΑ ΤΟ ΒΡΕΙΣ "ΠΟΤΕ" ΣΕ ΚΑΛΥΤΕΡΗ ΤΙΜΗ!!! Εγώ το χτύπησα από ΤΩΡΑ γιατί δεν ξέρω αν θα μπορέσω να έχω τόσο πολύ καλή τιμή...

Κάνει τα Δύσκολα… Εύκολα! Τραβάει με ΠΑΝΩ από 148km/h Σκούπα “Επαγγελματικού Τύπου” Υγρών & Στερεών Vevor στα 171€ Κομπλέ!!!

Ένα σοβαρό και δυνατό εργαλείο με δύναμη καινοτομίες και ιδιότητες όπως αυτές ακόμη και της άντλησης νερού ή λειτουργία blower, Χωρίς "φρου φρου κι...