Όταν σκέφτεστε τη συμβολή της Τεχνητής Νοημοσύνης στην Επιστήμη, πιθανότατα σκέφτεστε το AlphaFold, το πρόγραμμα διπλώματος πρωτεϊνών της Google DeepMind που χάρισε στον δημιουργό (Demis Hassabis) του το περσινό βραβείο Νόμπελ. Τώρα, η OpenAI λέει ότι μπαίνει και αυτή στο παιχνίδι της επιστήμης με ένα μοντέλο για τη μηχανική των πρωτεϊνών.
Η εταιρεία αναφέρει ότι έχει αναπτύξει ένα γλωσσικό μοντέλο που οραματίζεται πρωτεΐνες ικανές να μετατρέψουν κανονικά κύτταρα σε βλαστοκύτταρα και ότι έχει νικήσει με χαρακτηριστική ευκολία τον άνθρωπο σε αυτό το εγχείρημα.
Η εργασία αυτή αποτελεί το πρώτο μοντέλο της OpenAI που επικεντρώνεται σε βιολογικά δεδομένα και τον πρώτο δημόσιο ισχυρισμό της ότι τα μοντέλα της μπορούν να δώσουν απροσδόκητα επιστημονικά αποτελέσματα. Ως εκ τούτου, αποτελεί ένα βήμα προς τον προσδιορισμό του κατά πόσον η Τεχνητή Νοημοσύνη μπορεί ή όχι να κάνει πραγματικές ανακαλύψεις, κάτι που ορισμένοι υποστηρίζουν ότι αποτελεί σημαντική δοκιμασία στην πορεία προς την «Τεχνητή Γενική Νοημοσύνη» (AGI).
Την περασμένη εβδομάδα, ο CEO της OpenAI, Sam Altman, δήλωσε ότι είναι «σίγουρος» πως η εταιρεία του γνωρίζει πώς να κατασκευάσει μια AGI, προσθέτοντας ότι «τα υπερ-ευφυή εργαλεία θα μπορούσαν να επιταχύνουν μαζικά την επιστημονική ανακάλυψη και την καινοτομία πολύ πέρα από ό,τι είμαστε σε θέση να κάνουμε μόνοι μας».
Το project πρωτεϊνικής μηχανικής ξεκίνησε πριν από ένα χρόνο, όταν η Retro Biosciences, μια εταιρεία έρευνας μακροζωίας με έδρα το Σαν Φρανσίσκο, προσέγγισε την OpenAI για συνεργασία, κάτι που δεν έγινε τυχαία, διότι ο Sam Altman χρηματοδότησε προσωπικά την Retro με 180 εκατομμύρια δολάρια!
Η Retro έχει ως στόχο να παρατείνει τη φυσιολογική διάρκεια ζωής του ανθρώπου κατά 10 χρόνια. Για το σκοπό αυτό, μελετά τους λεγόμενους παράγοντες Yamanaka. Πρόκειται για ένα σύνολο πρωτεϊνών που, όταν προστεθούν σε ένα ανθρώπινο κύτταρο δέρματος, θα το κάνουν να μεταμορφωθεί σε ένα νεανικό βλαστικό κύτταρο, έναν τύπο που μπορεί να παράγει οποιονδήποτε άλλο ιστό στο σώμα.
Πρόκειται για ένα φαινόμενο που οι ερευνητές της Retro και των πλούσια χρηματοδοτούμενων εταιρειών όπως η Altos Labs, βλέπουν ως την πιθανή αφετηρία για την αναζωογόνηση των ζώων, την κατασκευή ανθρώπινων οργάνων ή την παροχή προμηθειών κυττάρων αντικατάστασης. Αλλά ένας τέτοιος «επαναπρογραμματισμός» κυττάρων δεν είναι πολύ αποτελεσματικός. Χρειάζονται αρκετές εβδομάδες και λιγότερο από το 1% των κυττάρων που υποβάλλονται σε επεξεργασία σε ένα εργαστηριακό πιάτο θα ολοκληρώσουν το ταξίδι της αναζωογόνησης.
Το νέο μοντέλο της OpenAI, που ονομάζεται GPT-4b micro, εκπαιδεύτηκε για να προτείνει τρόπους επανασχεδιασμού των πρωτεϊνικών παραγόντων ώστε να αυξηθεί η απόδοσή τους. Σύμφωνα με την OpenAI, οι ερευνητές χρησιμοποίησαν τις προτάσεις του AI μοντέλου για να αλλάξουν δύο από τους παράγοντες Yamanaka ώστε να είναι περισσότερο από 50 φορές πιο αποτελεσματικοί – τουλάχιστον σύμφωνα με ορισμένες προκαταρκτικές μετρήσεις.
«Απλά σε όλους τους τομείς, οι πρωτεΐνες φαίνονται καλύτερες από αυτές που οι επιστήμονες ήταν σε θέση να παράγουν μόνοι τους», αναφέρει ο John Hallman, ερευνητής της OpenAI. Ο Hallman και ο Aaron Jaech της OpenAI, καθώς και ο Rico Meinl από τη Retro, ήταν οι κύριοι προγραμματιστές του μοντέλου.
Οι εξωτερικοί επιστήμονες δεν θα είναι σε θέση να καταλάβουν αν τα αποτελέσματα είναι αληθινά μέχρι να δημοσιευτούν, κάτι που οι εταιρείες έχουν προγραμματίσει, όπως λένε. Επίσης, το μοντέλο δεν είναι διαθέσιμο για ευρύτερη χρήση – πρόκειται ακόμα για μια επίδειξη κατά παραγγελία, όχι για επίσημη παρουσίαση του προϊόντος.
«Αυτό το project έχει σκοπό να δείξει ότι είμαστε σοβαροί στο να συνεισφέρουμε στην Επιστήμη», δηλώνει ο Jaech. «Αλλά αν αυτές οι δυνατότητες θα βγουν στον κόσμο ως ξεχωριστό μοντέλο ή αν θα ενσωματωθούν στα κύρια μοντέλα συλλογισμού μας, αυτό μένει να καθοριστεί».
Το μοντέλο δεν λειτουργεί με τον ίδιο τρόπο όπως το AlphaFold της Google, το οποίο προβλέπει τι σχήμα θα πάρουν οι πρωτεΐνες. Δεδομένου ότι οι παράγοντες Yamanaka είναι ασυνήθιστα χαλαρές και αδόμητες πρωτεΐνες, σύμφωνα με την OpenAI, απαιτούσαν μια διαφορετική προσέγγιση, για την οποία τα μεγάλα γλωσσικά μοντέλα της ήταν κατάλληλα.
Το μοντέλο εκπαιδεύτηκε σε παραδείγματα πρωτεϊνικών αλληλουχιών από πολλά είδη, καθώς και σε πληροφορίες σχετικά με το ποιες πρωτεΐνες τείνουν να αλληλεπιδρούν μεταξύ τους. Αν και πρόκειται για πολλά δεδομένα, είναι μόνο ένα κλάσμα αυτών στα οποία εκπαιδεύτηκαν τα εμβληματικά chatbots της OpenAI, καθιστώντας το ένα παράδειγμα «μικρού γλωσσικού μοντέλου» που λειτουργεί με ένα εστιασμένο σύνολο δεδομένων.
Μόλις δόθηκε στους επιστήμονες της Retro το μοντέλο, προσπάθησαν να το κατευθύνουν ώστε να προτείνει πιθανούς επανασχεδιασμούς των πρωτεϊνών Yamanaka. Η τακτική προτροπής που χρησιμοποιήθηκε είναι παρόμοια με τη μέθοδο «λίγων βολών», κατά την οποία ένας χρήστης απευθύνει ερωτήματα σε ένα chatbot παρέχοντας μια σειρά παραδειγμάτων με απαντήσεις, ακολουθούμενη από ένα παράδειγμα για να απαντήσει το bot.
Παρόλο που οι γενετικοί μηχανικοί έχουν τρόπους να κατευθύνουν την εξέλιξη των μορίων στο εργαστήριο, μπορούν συνήθως να δοκιμάσουν μόνο τόσες πιθανότητες. Και ακόμη και μια πρωτεΐνη τυπικού μήκους μπορεί να αλλάξει με σχεδόν άπειρους τρόπους (δεδομένου ότι δομούνται από εκατοντάδες αμινοξέα και κάθε οξύ υπάρχει σε 20 πιθανές ποικιλίες). Το μοντέλο της OpenAI, ωστόσο, συχνά εμφανίζει προτάσεις στις οποίες έχει αλλάξει το ένα τρίτο των αμινοξέων των πρωτεϊνών.
«Ρίξαμε αμέσως αυτό το μοντέλο στο εργαστήριο και πήραμε αποτελέσματα από τον πραγματικό κόσμο», δηλώνει ο CEO της Retro, Joe Betts-Lacroix. Υποστηρίζει ότι οι ιδέες του μοντέλου ήταν ασυνήθιστα καλές, οδηγώντας σε βελτιώσεις σε σχέση με τους αρχικούς παράγοντες Yamanaka σε ένα σημαντικό κλάσμα των περιπτώσεων.
Ο Vadim Gladyshev, ένας ερευνητής του Πανεπιστημίου του Χάρβαρντ για τη γήρανση που συμβουλεύει τη Retro, λέει ότι χρειάζονται καλύτεροι τρόποι παραγωγής βλαστικών κυττάρων. «Για εμάς, θα ήταν εξαιρετικά χρήσιμο. Τα κύτταρα του δέρματος είναι εύκολο να επαναπρογραμματιστούν, ωστόσο, άλλα κύτταρα δεν μπορούν. Και για να το κάνεις σε ένα νέο είδος είναι συχνά εξαιρετικά διαφορετικό και δεν παίρνεις τίποτα».
Το πώς ακριβώς το GPT-4b καταλήγει στις εικασίες του δεν είναι ακόμη σαφές, όπως συμβαίνει συχνά με τα μοντέλα Τεχνητής Νοημοσύνης. «Είναι όπως όταν το AlphaGo συνέτριψε τον καλύτερο άνθρωπο στο Go, αλλά χρειάστηκε πολύς χρόνος για να μάθουμε το γιατί», τονίζει ο Betts-Lacroix. «Ακόμα προσπαθούμε να καταλάβουμε τι κάνει, και πιστεύουμε ότι ο τρόπος που το εφαρμόζουμε αυτό είναι μόνο η επιφάνεια που ξύσαμε».
[via]