Yeni veri depolama sistemi: DNA

DNA veri depolama

İçinde yaşadığımız krizler çağında karşımıza çıkan zorluklardan biri de veri depolama krizi. Youtube videolarından e-postalara, araştırmalardan uzay görüntülerine kadar veri miktarı arttıkça veri depolanması da sorun olmaya başladı. Bugünkü gibi veri üretmeye devam edersek, veri merkezlerinin silikon mikroçipleri 2040’tan önce tükenmiş olacak.

Mikroçipler yerine, bol miktarda karbon, hidrojen, oksijen ve nitrojen atomlarından oluşan başka bir depolama sistemi bizi bu krizden kurtarabilir. Canlıların depolama sistemi olan DNA’dan bahsediyoruz. Dünyadaki tüm bilgisayar verilerinin sadece bir kilogram DNA’da depolanabileceğini biliyor muydunuz?

2011 yılında bilim insanı Nick Goldman’ın arkadaşlarıyla konuşurken ortaya attığı “Veri depolaması için DNA’yı kullansak işimiz çok kolaylaşırdı” şakası, son çalışmalarla gerçeğe dönüşmeye başladı. Nick Goldman ve EBI laboratuvarı, bit’leri bilgisayarların 0,1 ile algıladığı sisteme dönüştürerek çalışmalar gerçekleştirdi. Her yeni çalışma, DNA’nın en kullanışlı depolama alanı olduğu fikrini desteklemeye devam etti.

DNA’yı geleneksel depolama sistemlerinden daha iyi yapan nedir?

Veri depolama sistemlerinni karşılaştırılması

Okuma-yazma hızı bilgisayarların sabit sürücüsünden yaklaşık 30 kat hızlı, veri saklama sürecinin 10 kat daha uzun olması sebeplerden sadece bir kaçı. Güç kullanımı ve veri yoğunluğu da düşünülünce DNA, bu zamana kadar üretilmiş en iyi disklerden daha iyi veri depolayabilir.  DNA’nın bu vaatleri, önde gelen şirketler için o kadar çekici ki bu konuda pek çok yatırım yapılmaya başlandı.

Nick Goldman ve EBI laboratuvarının yürüttüğü çalışmalardan sonra en ses getiren gelişme Microsoft ve Washington Üniversitesi’ndeki araştırmacıların tek bir dizgi havuzunda 151 kb’lık veri depolaması oldu. Halen devam eden çalışmalarda PCR ve CRISPR-Cas9 gibi en yeni genom yöntemleriyle ortaya çıkan sorunlar çözülmeye çalışılıyor.

Araştırmacılar, aktarım zorluklarının çözülebileceğini iddia etseler de o günden bu yana DNA depolanmasında öne çıkan çalışma görülmemişti. Uygulamanın gerçekleşmemesinde geleneksel yöntemleri yıkmanın zorluğu da sebep olarak sayılabilir.

Bakteri genomunda veri depolanması

Columbia Üniversitesi’nde yapılan en son çalışma, DNA’nın veri depolanmasında kullanımıyla ilgili önemli bir adım attı. Araştırmacılar, bilinen bir bakterinin genomunda kodlanmış mesajlar taşıyacak şekilde geliştirilebileceği haberini verdi.

Veriler, DNA moleküllerinde yüksek yoğunlukta saklanabilir, ancak bu konudaki mevcut çalışmaların çoğu laboratuvar ortamında üretilen DNA’ları kullanıyor. Columbia Üniversitesi’ndeki araştırmacılar, E. coli bakterisinin elektrik yardımıyla sıkıştırıldığında genomlarında belirgin değişikler gerçekleştiğini tespit etti. Bu sayede bilgisayarlarda kullanılan 1 ve 0 sistemine benzer şekilde, elektriksel yöntem ile depolama yapılabiliyor.

Araştırma ekibinin ortaya koyduğu canlı bakteri kullanımının birçok avantajı var. İlki tasarlanan genetik dizilerin kalıtsal olması; yavru hücreler tarafından kodlanan bilgileri taşımaya devam etmesi. Diğeri ise yüklenen bilgilerin bozulmadan korunabilmesi. Genetik veriler, güçlü bir barkod sistemi gibi çalıştığı için E. coli diğer bakteri türleriyle eşleştirilse bile veriler yeniden oluşturulabilir.

E.coli bakterisi

Sonuncu avantaj, genomda oluşturulan mesajların gizlenebilmesi için de büyük bir fırsat sağlıyor. Adeta gizli şifrelerle dolu bir casus romanı gibi, genomda gizli bilgiler saklayabiliriz.

CRISPR Devrimi

DNA depolamalarındaki ilerlemelere paralel olarak, CRISPR-Cas9 gen bölünme sisteminin keşfi, gen düzenlemede devrim yaratan adım oldu. Genomda DNA dizilimlerini kontrol eden CRISPR ile Cas9 enziminin birleşimiyle ortaya çıkarılan CRISPR-Cas9 teknolojisi sayesinde gen değişimlerinin önü açıldı. 2012 yılında yapılan keşif,neredeyse her organizmadaki gen dizisi çıkarılabilmesi veya hatalı protein kodlayan genlerin doğru protein kodlayan genlerle değiştirilmesini sağlıyor.

Columbia ekibi, elektron değişimlerindeki (redox) farklılıklara uyum sağlayabilen yeni bir CRISPR sistemi oluşturdu. Nature Chemical Biology1’de yayınlanan makalede, bunun laboratuvarda hedef mesajı sıralamak zorunda kalmadan doğrudan E. coli genomuna yazmalarını nasıl gerçekleştirdikleri açıklandı. Açıkladıkları yöntem sayesinde, bilgisayar bilgilerinni DNA’ya yazılması için doğrudan dijitalden biyolojik sisteme geçişe izin veriliyor.

Dna’nın biyoloji için önemli bir bilgi depolama ortamı olduğunu ve dijital çağda yeni nesil veri depolaması için büyük umut vaadettiğini söyleyen ekip, DNA tabanlı depolama çalışmalarının çoğunun DNA replikasyonu (in vitro DNA) yöntemine dayandığını söylüyor. Araştırmacılar, “DNA replikasyonu yönteminde dijital verilerin canlı hücrelerin kromozomlarına tek adımda kodlanması oldukça sınırlı” diyor. Yeni ortaya konulan yöntemle canlı hücrelerdeki dijital verilerin doğrudan depolanması için yeni bir elektrojenetik çerçeve tanımlanıyor. Elektron değişimlerine duyarlı olarak tasarlanan CRISPR adaptasyon sistemi ile elektriksel uyarımla bakteri hücrelerinin CRISPR dizilerine 3 bitlik birimler halinde ikili veriler kodlanmış. Bilgi depolamayı birçok nesil boyunca sürdürebilmek ve 72 bite kadar kapasite sağlamak için hücrelere veri kodlama öğretiliyor. Bu çalışma, dijitalden biyolojik veriye doğrudan  dönüşüm sağladığı için bilgi yükleme kapasitesini arttırıyor.

DNA’da veri güvenliği

Biyolojik veri depolama konusunda veri güvenliği tartışmaları da ön planda olan konulardan. Biyolojik hücrelerin dışarıdan etkileri farkettiğinde mutasyon geçirmesi veri kaybına yol açabilir. Yeni uyarım yönteminde ise bakterilerin doğal replikasyonundan faydalandığı için yedekleme sistemi oldukça güvenli.

Verileri dijital depolama sistemlerin kopyalamak ve taşımak verinin önem kazandığı dünyada giderek zorlaşıyor. Bir kilogram DNA, dünyanın tüm dijital verilerini içerebiliyorsa, biyolojik veri taşıma ve kopyalamanın ne kadar kolaylaşacağını düşünün. Koca bir şirketin tüm verileri toplu iğne başı büyüklüğünde bir kapta saklanabilir.

DNA’yı dijital depolama sistemlerinden öne çıkaran diğer bir özellik ise, internet üzerinden başka bir biyolojik sisteme aktarılabilir olması. En yaygın bakterilerden biri olan E.coli bakterisini istenilen bilgi doğrultusunda kodlamak yeterli olacaktır.

Akıllı tasarım

Cambridge araştırmacıların keşfi, akıllı tasarımla ilgili önemli ilkeleri bize yeniden hatırlattı. Bilginin onu ileten ortamdan bağımsız olması, bu keşfin en önemli yanını oluşturuyor. Bilginin yüklendiği E.coli bakterisi, kodun anlamından habersizdir. Bilim insanları tarafından bakteriye girilen yapay diziler, doğal dizilimler tarafından okunamaz ve değiştirilemez. Sadece kullanıcılar verileri çevirebilir, bu da biyolojik sistemleri dijital sistemlerden daha başarılı kılıyor.

DNA ve çeviri sistemleri

Canlı hücrelerin merkezi karmaşık ve kendi özgü bir çeviri sistemi vardır: DNA nükleotidlerinin aminoasit bilgilerine dönüştürüldüğü DNA çeviri sistemi. Nükleotid ve aminoasitler bilgi taşıyıcılarıdır, bilgi kaynağı değil. Taşınan iki kod, kodları birbiriyle ilişkilendirebilen makinelerde birleştirilir: RNA sentetazlarda. Nükleotid dizisi, amino asit ile anlamsal bir ilişki göstermez. RNA sentetaz ikisini bir araya getirir, çünkü bu şekilde kodlanmıştır.

Biyolojik sistemlerin işlem basamaklarında moleküllerin hiçbiri elindeki verilerin anlamlandırmaz. Sadece sistemin dışından verilen talimatları takip etmek üzere tasarlandıkları için süreci gerçekleştirir.

Biyolojideki bu gerçeği ele alan Columbia ekibinin çalışmaları da bu süreci taklit ediyor. Bakterilerin anlamlandıramadığı süreç sadece verilen talimatları yürütür ve sadece insanların anlamlandıracağı bir veri deposu oluşturur.

Merve Şimşek
1996 yılı Muğla doğumlu. Yıldız Teknik Üniversitesi’ndeki mimarlık eğitimini 2020 yılında tamamladı. Eğitimi sırasında mimari ofislerde gerçekleştirdiği staj çalışmalarına ek olarak Natura ve YAPI dergilerinin editör ekibinde yer aldı. Halen Natura Dergi’nin editörlüğünü yürütüyor. Mimari, sanat, edebiyata ek olarak teknoloji ve bilim konularına ilgi duyuyor. İngilizce ve İspanyolca biliyor.