Το νέο AI μοντέλο της Google που θέλει να επιταχύνει την ανάπτυξη φαρμάκων

7


Σύμφωνα με μια μελέτη του 2022 που δημοσιεύθηκε στο National Library of Medicine, το 90% των υποψήφιων φαρμάκων αποτυγχάνουν μετά τη φάση 1 της δοκιμής. Για τις εταιρείες που ασχολούνται με την ανάπτυξη θεραπειών που σώζουν ζωές, η διαδικασία είναι γεμάτη κινδύνους, όπως το ότι είναι πολύ αργή και κοστίζει δισεκατομμύρια δολάρια. Η Google ελπίζει να διευκολύνει αυτή τη διαδικασία με το τελευταίο της AI μοντέλο, το TxGemma.

Το TxGemma είναι ένας open source διάδοχος του Tx-LLM, το οποίο η Google παρουσίασε τον περασμένο Οκτώβριο για να βοηθήσει στην ανάπτυξη φαρμάκων. Το Tx-LLM συγκέντρωσε σημαντικό ενδιαφέρον από τους ενδιαφερόμενους, όπως οι ερευνητές φαρμάκων, οι οποίοι ήθελαν ένα μοντέλο για να το χρησιμοποιήσουν και να το τελειοποιήσουν για την ανάπτυξη θεραπευτικών εφαρμογών. Για να απαντήσει σε αυτό το κάλεσμα, η Google κυκλοφόρησε το TxGemma για προγραμματιστές οι οποίοι μπορούν να χρησιμοποιήσουν αυτό το μοντέλο στα δικά τους δεδομένα και για τις συγκεκριμένες εργασίες τους.

Το TxGemma βασίζεται στα μοντέλα Gemma της Google, αλλά διαφέρει στο ότι έχει εκπαιδευτεί για να βοηθήσει στην ανάπτυξη θεραπευτικών προϊόντων. Το TxGemma μπορεί να κατανοήσει και να προβλέψει τις ιδιότητες των θεραπευτικών προϊόντων καθ’ όλη τη διάρκεια της διαδικασίας ανάπτυξης. Μπορεί να βοηθήσει τους ερευνητές να εντοπίσουν τους πιο υποσχόμενους στόχους και μπορεί να προβλέψει τα αποτελέσματα των κλινικών δοκιμών, ώστε να χάνεται λιγότερος χρόνος.

Τα νέα μοντέλα TxGemma έχουν σχεδιαστεί για να είναι ευέλικτα. Τα μοντέλα διατίθενται σε τρία μεγέθη, ώστε οι προγραμματιστές να μπορούν να επιλέγουν τα κατάλληλα μοντέλα ανάλογα με τις δυνατότητες του hardware που έχουν στη διάθεσή τους. Διατίθενται με 2 δισεκατομμύρια παραμέτρους, 9 δισεκατομμύρια παραμέτρους και 27 δισεκατομμύρια παραμέτρους. Καθένα από αυτά διαθέτει μια έκδοση «predict» που μπορεί να χειριστεί στενές εργασίες όπως ταξινόμηση (π.χ., θα περάσει αυτό το μόριο τον αιματοεγκεφαλικό φραγμό;), παλινδρόμηση (π.χ., πρόβλεψη της συγγένειας πρόσδεσης ενός φαρμάκου) και παραγωγή (π.χ., δεδομένου του προϊόντος κάποιας αντίδρασης, δημιουργήστε το σύνολο των αντιδρώντων).

Αποδεικνύοντας την αποτελεσματικότητα του μεγαλύτερου μοντέλου παραμέτρων 27Β, η Google δήλωσε:

Το μεγαλύτερο μοντέλο TxGemma (έκδοση πρόβλεψης 27B) παρέχει ισχυρές επιδόσεις. Δεν είναι μόνο καλύτερο ή περίπου ίσο με το προηγούμενο σύγχρονο γενικευμένο μοντέλο μας (Tx-LLM) σε σχεδόν κάθε εργασία, αλλά επίσης ανταγωνίζεται ή ξεπερνά πολλά μοντέλα που έχουν σχεδιαστεί ειδικά για μεμονωμένες εργασίες. Συγκεκριμένα, υπερτερεί ή έχει συγκρίσιμες επιδόσεις με το προηγούμενο μοντέλο μας σε 64 από τις 66 εργασίες (νικώντας το σε 45), και κάνει το ίδιο απέναντι σε εξειδικευμένα μοντέλα σε 50 από τις εργασίες (νικώντας τα σε 26).

Εκτός από τα μοντέλα TxGemma, η Google έχει επίσης κυκλοφορήσει τα μοντέλα TxGemma-Chat σε διαμορφώσεις παραμέτρων 9B και 27B. Το ιδιαίτερο σε αυτά είναι ότι οι ερευνητές μπορούν να ζητήσουν από το μοντέλο να μοιραστεί το σκεπτικό του για τα συμπεράσματά του και να απαντήσει σε πολύπλοκες ερωτήσεις. Αυτές οι συζητήσεις θα μπορούσαν να βοηθήσουν τους ερευνητές να επιταχύνουν δραματικά την ανάπτυξη θεραπευτικών ουσιών.

Η Google ανακοίνωσε επίσης το Agentic-Tx που βασίζεται στο Gemini 2.0 Pro. Το Agentic-Tx στοχεύει να ξεπεράσει τους περιορισμούς γύρω από τις ενημερωμένες εξωτερικές πληροφορίες και την επιχειρηματολογία πολλών βημάτων. Είναι εξοπλισμένο με 18 εργαλεία που βοηθούν τους ερευνητές να επιτύχουν τους στόχους τους, όπως:

  • TxGemma ως εργαλείο για συλλογισμό πολλαπλών βημάτων
  • Γενικά εργαλεία αναζήτησης από το PubMed, τη Wikipedia και τον ιστό
  • Ειδικά μοριακά εργαλεία
  • Εργαλεία γονιδίων και πρωτεϊνών

Η Google δήλωσε ότι τα μοντέλα της είναι ανοικτά, οπότε αναμένει από την κοινότητα να τα βελτιώσει περαιτέρω και να δημοσιεύσει τυχόν βελτιώσεις που θα γίνουν.

[via]



Πηγή