Η IBM ανέπτυξε μια νέα οπτική τεχνολογία για την εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης με την «ταχύτητα του φωτός», εξοικονομώντας παράλληλα μεγάλη ποσότητα ενέργειας. Όπως δήλωσε, εφαρμόζοντας τις ανακαλύψεις της στα κέντρα δεδομένων, η ενέργεια που εξοικονομείται κατά την εκπαίδευση ενός μοντέλου τεχνητής νοημοσύνης είναι ισοδύναμη με την ετήσια κατανάλωση ενέργειας 5.000 κατοικιών στις ΗΠΑ.
Η εταιρεία εξήγησε ότι ενώ τα κέντρα δεδομένων συνδέονται με τον εξωτερικό κόσμο με καλώδια οπτικών ινών, εσωτερικά, όπως λέει, εξακολουθούν να χρησιμοποιούν καλώδια χαλκού. Τα καλώδια συνδέουν επιταχυντές GPU, οι οποίοι περνούν πολύ χρόνο σε αδράνεια περιμένοντας δεδομένα από άλλες συσκευές, ενώ καταναλώνουν ενέργεια και αυξάνουν το κόστος.
Σχολιάζοντας την εξέλιξη, ο Dario Gil, SVP και διευθυντής έρευνας της IBM, δήλωσε:
Καθώς η παραγωγική τεχνητή νοημοσύνη απαιτεί περισσότερη ενέργεια και επεξεργαστική ισχύ, το κέντρο δεδομένων πρέπει να εξελιχθεί – και τα συμπαγή οπτικά μπορούν να καταστήσουν αυτά τα κέντρα δεδομένων ανθεκτικά στο μέλλον. Με αυτή την ανακάλυψη, τα τσιπ του αύριο θα επικοινωνούν όπως ακριβώς τα καλώδια οπτικών ινών μεταφέρουν δεδομένα μέσα και έξω από τα κέντρα δεδομένων, εγκαινιάζοντας μια νέα εποχή ταχύτερων, πιο βιώσιμων επικοινωνιών που μπορούν να χειριστούν τους φόρτους εργασίας AI του μέλλοντος.
Η IBM περιγράφει το νέο της πρωτότυπο οπτικής συν-συσκευασίας (CPO) σε ένα τεχνικό έγγραφο. Με τη σημαντική αύξηση του εύρους ζώνης στα κέντρα δεδομένων, ο χρόνος διακοπής λειτουργίας των GPU θα μπορούσε να ελαχιστοποιηθεί, επιταχύνοντας την επεξεργασία AI.
Η IBM εξηγεί ότι η εκπαίδευση μεγάλων γλωσσικών μοντέλων (LLM) θα μπορούσε να μειωθεί από τρεις μήνες σε τρεις εβδομάδες. Ταυτόχρονα, η αυξημένη ενεργειακή απόδοση θα μείωνε τη χρήση ενέργειας και θα μείωνε το κόστος που σχετίζεται με την εκπαίδευση των LLMs.
[via]