Ο υπερυπολογιστής Eos της NVIDIA έσπασε το δικό του ρεκόρ εκπαίδευσης AI

Η εκπαίδευση ενός μεγάλου γλωσσικού μοντέλου μπορεί να διαρκέσει εβδομάδες, μήνες, ακόμη και χρόνια για να ολοκληρωθεί ανάλογα με το hardware. Γι’ αυτό και όταν επιτυγχάνεται σπουδαία πρόοδος, είναι κάτι αξιοσημείωτο.

Την Τετάρτη, η NVIDIA παρουσίασε την πιο πρόσφατη έκδοση του υπερυπολογιστή της Eos, ο οποίος τροφοδοτείται από περισσότερες από 10.000 H100 Tensor Core GPUs και είναι σε θέση να εκπαιδεύσει ένα μοντέλο GPT-3 με 175 δισεκατομμύρια παραμέτρους σε 1 δισεκατομμύριο τοκενς σε λιγότερο από τέσσερα λεπτά. Αυτό είναι τρεις φορές πιο γρήγορο από το προηγούμενο ρεκόρ στον βιομηχανικό πρότυπο της AI MLPerf, το οποίο η NVIDIA είχε πετύχει μόλις πριν από έξι μήνες.

Το Eos χρησιμοποιεί 10.752 GPUs που συνδέονται με το δίκτυο Infiniband της NVIDIA και 860 τεραμπάιτ υψηλής ταχύτητας μνήμης για να παρέχει 40 exaflops υπολογιστική ισχύ AI. Η συνολική αρχιτεκτονική στο cloud αποτελείται από 1344 κόμβους – ατομικούς διακομιστές στους οποίους οι εταιρείες μπορούν να ενοικιάσουν πρόσβαση για περίπου $37.000 τον μήνα για την επέκταση των δυνατοτήτων τους στην τεχνητή νοημοσύνη χωρίς να χρειάζεται να δημιουργήσουν τη δική τους υποδομή.

Συνολικά, η NVIDIA έκανε έξι ρεκόρ σε εννέα δοκιμές benchmark: με 3,9 λεπτά για το GPT-3, 2,5 λεπτά για να εκπαιδευτεί ένα μοντέλο Stable Diffusion χρησιμοποιώντας 1.024 Hopper GPUs, 1 λεπτό για το DLRM, 55,2 δευτερόλεπτα για το RetinaNet, 46 δευτερόλεπτα για το 3D U-Net και μόλις 7,2 δευτερόλεπτα για το μοντέλο BERT-Large.

Η NVIDIA έσπευσε να σημειώσει ότι η έκδοση 175 δισεκατομμυρίων παραμέτρων του GPT-3 που χρησιμοποιήθηκε στη συγκριτική αξιολόγηση δεν είναι η επανάληψη πλήρους μεγέθους του μοντέλου (ούτε το μοντέλο Stable Diffusion). Το μεγαλύτερο GPT-3 προσφέρει περίπου 3,7 τρισεκατομμύρια παραμέτρους και είναι απλά πολύ μεγάλο και δυσκίνητο για χρήση σε δοκιμή συγκριτικής αξιολόγησης. Για παράδειγμα, θα χρειαζόταν 18 μήνες για να το εκπαιδεύσετε στο παλαιότερο σύστημα A100 με 512 GPU αλλά το Eos χρειάζεται μόλις οκτώ ημέρες.

Αντίθετα, η NVIDIA και η MLCommons, η οποία διαχειρίζεται το πρότυπο MLPerf, αξιοποιούν μια πιο συμπαγή έκδοση που χρησιμοποιεί 1 δισεκατομμύριο tokens (η μικρότερη μονάδα παρονομαστή δεδομένων που κατανοούν τα συστήματα παραγωγής τεχνητής νοημοσύνης).

Η NVIDIA εστιάζει συνεχώς στις δυνατότητες και τις εφαρμογές της AI τους τελευταίους μήνες. «Βρισκόμαστε στη στιγμή του iPhone για την τεχνητή νοημοσύνη», δήλωσε ο διευθύνων σύμβουλος Jensen Huang κατά τη διάρκεια της κεντρικής ομιλίας του στο GTC τον Μάρτιο. Εκείνη την εποχή, η εταιρεία ανακοίνωσε το σύστημα cloud DGX της, το οποίο κατανέμει κομμάτια της επεξεργαστικής ισχύος του υπερυπολογιστή — συγκεκριμένα με οκτώ τσιπ H100 ή A100 με 60 GB VRAM (640 μνήμη συνολικά). Η εταιρεία επέκτεινε το χαρτοφυλάκιο υπερυπολογιστών της με την κυκλοφορία του DGX GH200 στην Computex τον Μάιο.

ΠΗΓΗ

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Leave a reply

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

ΠΡΟΣΦΑΤΑ ΑΡΘΡΑ

(Part 1)Το “ΑΠΙΘΑΝΟ” Kukirin X1 Mini Dirt Bike. Δοκιμή σε πίστα από Έλληνα Πρωταθλητή Moto Cross και ΔΙΚΟ σου στα 1121€ ΚΟΜΠΛΕ!!! (Βίντεο)

Είναι πραγματικά τόσο "ΑΠΙΘΑΝΑ" ποιοτικό, δυνατό κι όμορφο, όσο και πολύ κοντά στην ΕΛΛΗΝΙΚΗ κατηγορία Mini Cross ΜΧ50. Είναι το Kukirin X1 και είναι ένα...

Nvidia: Αναβαθμίστε αμέσως του drivers σας

H Nvidia κυκλοφόρησε νέα ενημέρωση για τους drivers των GPU της, που από ότι φαίνεται κλείνει 14 ευπάθειες, τόσο για Windows, όσο και για...

Η Samsung ετοιμάζει rollable κινητό που ξετυλίγεται

Μια νέα ευρεσιτεχνία της Samsung, που εντοπίστηκε από το WearView, δείχνει ότι η εταιρεία εξερευνά ενεργά τη δημιουργία rollable smartphone — δηλαδή κινητού με...

Odyssey G8: Η Samsung ανακοίνωσε τις next-gen gaming οθόνες της!

Η Samsung ανακοίνωσε τις next-gen gaming οθόνες της που έρχονται με την ονομασία Samsung Odyssey G8, όπου οι gamers θα βρουν πολλά και διαφορετικά μοντέλα. Η G8 σειρά θα αποτελείται από τρες οθόνες και...

Micro RGB: Η τεχνολογία τηλεόρασης που χτυπά OLED και Mini-LED

Η τεχνολογία Micro RGB αναδεικνύεται ως η σημαντικότερη εξέλιξη στις τηλεοράσεις φέτος, φέρνοντας μια νέα λογική στο πώς οι οθόνες παράγουν χρώμα και φωτεινότητα....

ΤΕΛΕΥΤΑΙΕΣ ΠΡΟΣΦΟΡΕΣ

(Part 1)Το “ΑΠΙΘΑΝΟ” Kukirin X1 Mini Dirt Bike. Δοκιμή σε πίστα από Έλληνα Πρωταθλητή Moto Cross και ΔΙΚΟ σου στα 1121€ ΚΟΜΠΛΕ!!! (Βίντεο)

Είναι πραγματικά τόσο "ΑΠΙΘΑΝΑ" ποιοτικό, δυνατό κι όμορφο, όσο και πολύ κοντά στην ΕΛΛΗΝΙΚΗ κατηγορία Mini Cross ΜΧ50. Είναι το Kukirin X1 και είναι ένα...

Power Bank 10000mah από Ελλάδα σε “Τιμή ΚΙΝΑΣ”! Charmast W1056 στα 18€ κομπλέ και Giveaway

Δεν ξέρω αν είναι το καλύτερο, δυνατότερο και ελαφρύτερο... αλλά σίγουρα ξέρω πως είναι σε "Τιμή ΚΙΝΑΣ" και είναι παντού και πάντα χρήσιμο! Βέβαια περί...

Το Πιο FULL & “ΨΑΓΜΕΝΟ” Επώνυμο με ΚΑΘΙΣΜΑ και 2πλο Κουπί SUP (Stand Up Paddle). Είναι “Μεγάλο” με 3,5m μήκος & 180+ Κιλά Load…...

Ένα πραγματικό όνειρο για πολλούς και πολλές από εμάς... Ένα FULL & "ΨΑΓΜΕΝΟ" Επώνυμο με ΚΑΘΙΣΜΑ και 2πλο Κουπί SUP που παρακαλούσαμε να βρούμε...

2 Φθηνά, επώνυμα και χρήσιμα “Για ‘Μένα”! Super Mini Κομπρεσεράκι Popdeer και Premium Jet Fan Foursun (Video)

Είναι χρήσιμα, πολύ ποιοτικά, ιδιαίτερα το καθένα με τον "δικό του" τρόπο κι έχουν έρθει για προσωπική χρήση. Είναι και τα 2 από Ευρώπη και...

Από Ελλάδα Ηλιακό Πάνελ 80Watt σε ΤΙΜΗ “Κίνας”! Ο Απόλυτος Φίλος του καλοκαιριού… Στα 89€ Κομπλέ Cheotech SC007 (Video)

Η τιμή για την ποιότητα του είναι Κίνας κι όχι Ελλάδας Ήρθε την πιο κατάλληλη στιγμή αν και στην χώρα μας θεωρώ πως ότι ηλιακό...