Μια νέα προσέγγιση στην αποθήκευση δεδομένων σε DNA

0


Οι επιστήμονες ανέπτυξαν μια νέα προσέγγιση για τη χρήση του DNA ως μέσου αποθήκευσης δεδομένων, μειώνοντας το κόστος και τον χρόνο εγγραφής στη βιολογική ουσία.

Εδώ και δεκαετίες, οι επιστήμονες μελετούν τις δυνατότητες του δεοξυριβονουκλεϊκού οξέος, το οποίο περιέχει τις γενετικές οδηγίες για την ανάπτυξη και τη λειτουργία ενός οργανισμού, ως υλικό για την αποθήκευση δεδομένων λόγω της πρωτοφανούς πυκνότητάς του.

Θεωρητικά, ένα μόνο γραμμάριο DNA θα μπορούσε να αποθηκεύσει 215.000 terabytes δεδομένων, αλλά από την πρώτη επίδειξη των δυνατοτήτων αποθήκευσης δεδομένων του, οι επιστήμονες αγωνίστηκαν να δείξουν πώς θα μπορούσε να γίνει μέρος ενός πρακτικού υπολογιστικού συστήματος.

Οι καθιερωμένες τεχνικές βασίζονται στην κατασκευή αλληλουχιών DNA από το μηδέν για την μετατροπή του σε μέσο αποθήκευσης. Η διαδικασία που είναι γνωστή ως “de novo” είναι χρονοβόρα, δαπανηρή και επιρρεπής σε σφάλματα.

Οι ερευνητές έχουν ήδη αναπτύξει άλλες τεχνικές για την αποθήκευση δεδομένων απευθείας στο DNA ζωντανών βακτηριακών κυττάρων με τη χρήση μιας ηλεκτρομαγνητικής τεχνικής.

Ωστόσο, η τρέχουσα έρευνα πηγαίνει ένα βήμα παραπέρα χρησιμοποιώντας τη φυσική μεθυλίωση, τη διαδικασία που αποτελεί μέρος της επιγενετικής τροποποίησης του DNA, η οποία συμβαίνει κατά τη διάρκεια της ζωής ενός ατόμου και όχι μεταξύ γενεών.

Σε μια δημοσίευση στο Nature, ο αναπληρωτής καθηγητής του Πανεπιστημίου του Πεκίνου Cheng Zhang και οι συνεργάτες του περιγράφουν μια επίδειξη που κωδικοποιεί δεδομένα στα λεγόμενα “epi-bits” και αναπαράγει μια εικόνα ενός κινεζικού ανάγλυφου(16.833 bits) και μια φωτογραφία ενός πάντα (252.504 bits) χρησιμοποιώντας τη μέθοδο χωρίς σύνθεση. Υποστηρίζουν ότι είναι ικανή να κωδικοποιεί και να διαβάζει δεδομένα με εξαιρετικά βελτιωμένο ρυθμό σε σύγκριση με προηγούμενες προσεγγίσεις.

Σε συνοδευτικό άρθρο, οι ερευνητές πληροφορικής του Πανεπιστημίου της Ουάσιγκτον Carina Imburgia και Jeff Nivala δήλωσαν ότι η ομάδα του Zhang σηματοδότησε “μια νέα κατεύθυνση στην αποθήκευση δεδομένων με βάση το DNA, η οποία έχει τη δυνατότητα να παρακάμψει τους χρονικούς και οικονομικούς περιορισμούς των συμβατικών προσεγγίσεων“.

Εκτός από τη βελτίωση των επιδόσεων της αποθήκευσης DNA, οι ερευνητές διεύρυναν επίσης τη χρηστικότητά της. Δημιούργησαν μια πλατφόρμα με την ονομασία iDNAdrive και έδειξαν ότι 60 εθελοντές από διαφορετικά ακαδημαϊκά υπόβαθρα μπορούσαν να τη χρησιμοποιήσουν για να κωδικοποιήσουν χειροκίνητα περίπου 5.000 bits δεδομένων κειμένου.

Το πλαίσιό μας παρουσιάζει έναν νέο τρόπο αποθήκευσης δεδομένων DNA που είναι παράλληλος, προγραμματιζόμενος, σταθερός και κλιμακούμενος. Ένας τέτοιος αντισυμβατικός τρόπος ανοίγει δρόμους προς την πρακτική αποθήκευση δεδομένων και τις λειτουργίες δεδομένων διπλού τρόπου σε βιομοριακά συστήματα“, δήλωσαν οι συγγραφείς.

Με την αποθήκευση δεδομένων DNA να εισέρχεται στην αυγή της εμπορευματοποίησης, το πλαίσιο epi-bit δείχνει πιθανές κατευθύνσεις στην παράλληλη αποθήκευση μοριακών πληροφοριών με προκατασκευασμένη αρθρωτή δομή“.

Ωστόσο, υπάρχει πολύς δρόμος να διανυθεί μέχρι η τεχνική να μπορέσει να ανταγωνιστεί τους mainstream υπολογιστές. Για αρχή, υπάρχει η ταχύτητα. Ακόμη και με τις προσπάθειες για τη βελτίωση της ταχύτητας με τη χρήση barcodes epi-bit αντί για barcodes αλληλουχίας DNA και μια αυτοματοποιημένη πλατφόρμα χειρισμού υγρών, ο ρυθμός εγγραφής δεδομένων ήταν 40 bits ανά δευτερόλεπτοΈνας SSD μπορεί να αναμένεται να διαβάζει και να γράφει με ταχύτητα 200-550 MBps.

Εν τω μεταξύ, οι Imburgia και Nivala επισημαίνουν ερωτήματα σχετικά με τη μακροπρόθεσμη σταθερότητα των μεθυλικών σημάτων που δημιουργούνται με την τεχνική αυτή.

Ακόμα περισσότερες προκλήσεις αναμένονται στη χρήση της τεχνικής για τη δημιουργία RAM, η οποία επιτρέπει την τυχαία πρόσβαση σε οποιοδήποτε μέρος των αποθηκευμένων δεδομένων. “Στο σύστημα epi-bit, ολόκληρη η βάση δεδομένων θα έπρεπε να αλληλουχηθεί για να προσπελαστεί οποιοδήποτε υποσύνολο των αρχείων, κάτι που θα ήταν αναποτελεσματικό με την αλληλούχιση νανοπόρων“.

Ενώ το κόστος της προσέγγισης epi-bit ήταν μεγαλύτερο από εκείνο των σημερινών συστημάτων δεδομένων DNA, το εμπόδιο αυτό θα μπορούσε να ξεπεραστεί με περαιτέρω βελτιστοποίηση της διαδικασίας και αυτοματοποίηση, δήλωσαν οι σχολιαστές. 



Πηγή