Θα μπορούσαν όλες οι ψηφιακές σας φωτογραφίες να αποθηκευτούν σε DNA;

Αυτή τη στιγμή στη Γη υπάρχουν περίπου 10 τρισεκατομμύρια gigabytes ψηφιακών δεδομένων ενώ κάθε μέρα οι άνθρωποι παράγουν μηνύματα ηλεκτρονικού ταχυδρομείου, φωτογραφίες, tweets και άλλα ψηφιακά αρχεία που προσθέτουν άλλα 2,5 εκατομμύρια gigabytes. Πολλά από αυτά τα δεδομένα αποθηκεύονται σε τεράστιες εγκαταστάσεις, γνωστές ως κέντρα δεδομένων Exabyte (ένα exabyte είναι 1 δισεκατομμύριο gigabytes), τα οποία μπορεί να έχουν το μέγεθος αρκετών γηπέδων ποδοσφαίρου, και κοστίζουν περίπου 1 δισεκατομμύριο δολάρια για την κατασκευή και τη συντήρησή τους.

Πολλοί επιστήμονες πιστεύουν ότι μια εναλλακτική λύση βρίσκεται στο DNA, το οποίο μπορεί να αποθηκεύσει τεράστιες ποσότητες πληροφοριών. Μια κούπα καφέ γεμάτη DNA θα μπορούσε θεωρητικά να αποθηκεύσει όλα τα δεδομένα του κόσμου, λέει ο Μαρκ Μπαθ, καθηγητής βιολογικής μηχανικής στο ΜΙΤ.

«Χρειαζόμαστε νέες λύσεις για την αποθήκευση αυτών των τεράστιων ποσοτήτων δεδομένων που συσσωρεύει ο κόσμος και ειδικά των αρχειακών δεδομένων», λέει ο Μπαθ. «Το DNA είναι χίλιες φορές πυκνότερο ακόμη και από τη μνήμη flash, ενώ από τη στιγμή που φτιάχνεις το πολυμερές DNA, δεν καταναλώνει καθόλου ενέργεια και μπορείτε να το αποθηκεύσετε για πάντα».

Οι επιστήμονες έχουν ήδη αποδείξει ότι μπορούν να κωδικοποιήσουν εικόνες και σελίδες κειμένου σε μικρές τεχνητές αλυσίδες DNA. Ωστόσο, θα πρέπει να αναπτύξουν μια εύκολη τεχνική ώστε να μπορεί κάποιος να επιλέξει το επιθυμητό αρχείο από ένα μείγμα πολλών κομματιών DNA. Ο Μπαθ και οι συνεργάτες του βρήκαν έναν τρόπο για να το κάνουν αυτό, ενθυλακώνοντας κάθε αρχείο δεδομένων σε ένα σωματίδιο πυριτίας 6 μικρομέτρων, το οποίο επισημαίνεται με σύντομες αλληλουχίες DNA που αποκαλύπτουν το περιεχόμενό του.

Χρησιμοποιώντας αυτή την προσέγγιση, οι ερευνητές μπόρεσαν να ανακτήσουν με ακρίβεια μεμονωμένες εικόνες που ήταν αποθηκευμένες ως αλληλουχίες DNA από ένα σύνολο 20 εικόνων. Με αυτή την προσέγγιση, θα μπορούσαν να ανακτηθούν 1.020 αρχεία.

Σταθερή αποθήκευση

Τα ψηφιακά συστήματα αποθήκευσης κωδικοποιούν κείμενο, φωτογραφίες ή οποιοδήποτε άλλο είδος πληροφορίας χρησιμοποιώντας μια σειρά από 0 και 1. Οι ίδιες πληροφορίες μπορούν να κωδικοποιηθούν στο DNA χρησιμοποιώντας τα τέσσερα νουκλεοτίδια που αποτελούν τον γενετικό κώδικα. Για παράδειγμα, το G και το C μπορούν να χρησιμοποιηθούν για την αναπαράσταση του 0, ενώ το Α και το Τ για την αναπαράσταση του 1.

Το DNA έχει πολλά άλλα χαρακτηριστικά που το καθιστούν επιθυμητό ως μέσο αποθήκευσης. Είναι εξαιρετικά σταθερό και αρκετά εύκολο (αλλά ακριβό) να συντεθεί και να αλληλουχηθεί. Επίσης, λόγω της υψηλής πυκνότητάς του, ένα exabyte δεδομένων θα μπορούσε να χωρέσει στην παλάμη του χεριού σας.

Μια από τις προκλήσεις αυτής της τεχνικής είναι και το κόστος σύνθεσης μεγάλων ποσοτήτων DNA. Σήμερα, το κόστος ενός petabyte δεδομένων (1 εκατομμύριο gigabytes) ανέρχεται στο 1 τρισεκατομμύριο δολάρια. Για να γίνει ανταγωνιστικό, ο Μπαθ εκτιμά ότι το κόστος σύνθεσης του DNA θα πρέπει να μειωθεί κατά περίπου 6 τάξεις μεγέθους. Ο επιστήμονας αναμένει ότι αυτό θα συμβεί μέσα σε μία ή δύο δεκαετίες.

«Αν υποθέσουμε ότι οι τεχνολογίες για την εγγραφή του DNA φτάσουν σε ένα σημείο όπου θα είναι οικονομικά αποδοτικό να γράψουμε ένα exabyte ή zettabyte δεδομένων στο DNA, τότε τι θα συμβεί; Θα έχετε ένα σωρό DNA, το οποίο θα περιέχει εκατομμύρια αρχεία, εικόνες, ταινίες και άλλα πράγματα, και θα πρέπει να βρείτε τη μία εικόνα ή ταινία που ψάχνετε, λέει ο Μπαθ. «Είναι σαν να προσπαθείς να βρεις βελόνα στα άχυρα».

Επί του παρόντος, τα αρχεία DNA ανακτώνται συμβατικά με τη χρήση PCR (αλυσιδωτή αντίδραση πολυμεράσης). Κάθε αρχείο δεδομένων DNA περιλαμβάνει μια αλληλουχία που συνδέεται με έναν συγκεκριμένο εκκινητή PCR. Για την ανάκτηση ενός συγκεκριμένου αρχείου, ο εκκινητής αυτός προστίθεται στο δείγμα για να βρει και να ενισχύσει την επιθυμητή αλληλουχία. Ωστόσο, υπάρχει περίπτωση να διασταυρωθεί ο εκκινητής με άσχετες αλληλουχίες DNA, με αποτέλεσμα να ανακτηθούν ανεπιθύμητα αρχεία. Επίσης, η διαδικασία ανάκτησης με PCR απαιτεί ένζυμα και καταλήγει να καταναλώνει το μεγαλύτερο μέρος του DNA.

Ανάκτηση αρχείων

Ως εναλλακτική προσέγγιση, η ομάδα του ΜΙΤ ανέπτυξε μια νέα τεχνική ανάκτησης που περιλαμβάνει την ενθυλάκωση κάθε αρχείου DNA σε ένα μικρό σωματίδιο διοξειδίου του πυριτίου. Κάθε κάψουλα επισημαίνεται με «γραμμωτούς κώδικες» μονόκλωνου DNA που αντιστοιχούν στο περιεχόμενο του αρχείου. Οι ερευνητές κωδικοποίησαν 20 διαφορετικές εικόνες σε κομμάτια DNA μήκους περίπου 3.000 νουκλεοτιδίων, που ισοδυναμούν με περίπου 100 bytes. Έδειξαν επίσης ότι οι κάψουλες θα μπορούσαν να χωρέσουν αρχεία DNA μεγέθους έως και ενός gigabyte.

Κάθε αρχείο ήταν επισημασμένο με γραμμωτούς κώδικες που αντιστοιχούσαν σε ετικέτες όπως «γάτα» ή «αεροπλάνο». Όταν οι ερευνητές ήθελαν να ανακτήσουν μια συγκεκριμένη εικόνα, αφαιρούσαν ένα δείγμα του DNA και πρόσθεταν εκκινητές που αντιστοιχούσαν στις ετικέτες που αναζητούσαν.

Οι εκκινητές είναι επισημασμένοι με φθορίζοντα ή μαγνητικά σωματίδια, καθιστώντας εύκολη την εξαγωγή και τον εντοπισμό τυχόν αντιστοιχιών από το δείγμα. Αυτό επιτρέπει την αφαίρεση του επιθυμητού αρχείου, ενώ το υπόλοιπο DNA παραμένει άθικτο και μπορεί να αρχειοποιηθεί ξανά.

«Στην παρούσα φάση βρισκόμαστε στον ρυθμό αναζήτησης 1 kilobyte ανά δευτερόλεπτο. Ο ρυθμός αναζήτησης του συστήματος αρχείων μας καθορίζεται από το μέγεθος των δεδομένων ανά κάψουλα, το οποίο περιορίζεται επί του παρόντος από το αστρονομικό κόστος για την εγγραφή δεδομένων αξίας ακόμη και 100 megabytes στο DNA, και από τον αριθμό των διαχωριστών που μπορούμε να χρησιμοποιήσουμε παράλληλα. Αν μειωθεί το κόστος σύνθεσης του DNA, θα είμαστε σε θέση να μεγιστοποιήσουμε το μέγεθος των δεδομένων που θα μπορούμε να αποθηκεύσουμε ανά αρχείο», λέει ο Μπαθ.

Για τους γραμμωτούς κώδικες τους, οι ερευνητές χρησιμοποίησαν μονόκλωνες αλληλουχίες DNA από μια βιβλιοθήκη 100.000 αλληλουχιών, μήκους περίπου 25 νουκλεοτιδίων η καθεμία, που ανέπτυξε ο Στίβεν Έλλετζ, καθηγητής γενετικής στην Ιατρική Σχολή του Χάρβαρντ.

Ο Μπαθ πιστεύει ότι αυτού του είδους η ενθυλάκωση του DNA θα μπορούσε να είναι χρήσιμη για την αποθήκευση «ψυχρών» δεδομένων στα οποία δεν υπάρχει πολύ συχνή πρόσβαση. Το εργαστήριό του ίδρυσε μια νεοσύστατη επιχείρηση, την Cache DNA, η οποία αναπτύσσει τεχνολογία τόσο για την μακροπρόθεσμη αποθήκευση δεδομένων DNA, όσο και για τη βραχυπρόθεσμη αποθήκευση κλινικών και άλλων δειγμάτων DNA.

«Αν και μπορεί να περάσει καιρός μέχρι το DNA να γίνει ένα βιώσιμο μέσο αποθήκευσης δεδομένων, υπάρχει πιεστική ανάγκη να βρεθούν λύσεις αποθήκευσης χαμηλού κόστους για προϋπάρχοντα δείγματα DNA και RNA από διαγνωστικά τεστ Covid-19, αλληλούχιση ανθρώπινου γονιδιώματος και άλλους τομείς της γονιδιωματικής», αναφέρει ο επιστήμονας.

Η έρευνα χρηματοδοτήθηκε από το Γραφείο Ναυτικής Έρευνας, το Εθνικό Ίδρυμα Επιστημών και το Γραφείο Έρευνας του Στρατού των ΗΠΑ.

ΠΗΓΗ: Eurekalert

Όλες οι Ειδήσεις από την Ελλάδα και τον Κόσμο,  στο ertnews.gr
Διάβασε όλες τις ειδήσεις μας στο Google
Κάνε like στη σελίδα μας στο Facebook
Ακολούθησε μας στο Twitter
Κάνε εγγραφή στο κανάλι μας στο Youtube
Προσοχή! Επιτρέπεται η αναδημοσίευση των πληροφοριών του παραπάνω άρθρου (όχι αυτολεξεί) ή μέρους αυτών μόνο αν:
– Αναφέρεται ως πηγή το ertnews.gr στο σημείο όπου γίνεται η αναφορά.
– Στο τέλος του άρθρου ως Πηγή
– Σε ένα από τα δύο σημεία να υπάρχει ενεργός σύνδεσμος