Đại học Harvard tạo bước ngoặt lớn khi lưu trữ thành công một cuốn sách trên các chuỗi ADN

shinbehv
17/8/2012 9:54Phản hồi: 160
Đại học Harvard tạo bước ngoặt lớn khi lưu trữ thành công một cuốn sách trên các chuỗi ADN
sn-storage-thumb-800xauto-14310.jpg
Tương lai của lưu trữ thông tin số sẽ là công nghệ DNA

Do có những đặc điểm vượt trội so với các thiết bị bán dẫn truyền thống, DNA (ở Việt Nam hay gọi là ADN) đã được các nhà khoa học trong lĩnh vực lưu trữ quan tâm từ lâu. Rất tiếc những kết quả thu được thời gian qua vẫn chưa đáp ứng được các yêu cầu để tối thiểu để áp dụng chúng ở quy mô công nghiệp trong những năm tới. Tuy nhiên, nghiên cứu mới đây của các nhà khoa học từ Đại học Harvard đã tạo nên một bước đột phá lịch sử khi họ sử dụng DNA để mã hóa thành công toàn bộ 70 tỷ bản sao của một cuốn sách tiếng Anh có 53.426 từ, cùng với 11 ảnh định dạng JPG và các đoạn mã JavaScript. Được biết, dung lượng những tài liệu trên tương đương với dãy nhị phân dài 5,27 Megabit. Con số này lớn hơn gần 1000 lần so với thành tựu đạt được gần đây và mở ra triển vọng sản xuất các thiết bị ghi sinh học trong vòng 5 hoặc 10 năm nữa.

Khả năng lưu trữ của DNA (trên lý thuyết)

dna-structure.jpg
Thông tin có thể mã hóa nhờ các nucleotide trên chuỗi xoắn kép

DNA, hay các axít deoxyribonucleotide được biết như là thành phần cơ bản chứa các thông tin di truyền ở các sinh vật sống. Về cấu tạo, bất kì chuỗi DNA nào đều chứa 4 loại nucleotide là A, T, G và C (một số tài liệu gọi là X hoặc U). Theo lý thuyết, mỗi nucleotide có thể được sử dụng để mã hóa một bit dữ liệu. Nhưng thực tế phân tử DNA là một chuỗi xoắn kép được cấu thành từ hai dải nucleotide đơn và các nucleotide ở mỗi chuỗi đơn sẽ kết hợp với nhau theo đúng quy tắc A-T và G-C (X/U), nên thực tế một vị trí trên DNA sẽ tương ứng với 2 bit.

transforming-usb-flash.jpg

Các thiết bị như ổ flash sẽ không có được sức mạnh như hổ báo của chúng so với lưu trữ DNA

Theo ước tính, một milimet khối DNA có khả năng lưu trữ 1 triệu tỷ GB và một gram phân tử này có thể lưu tới 455 tỷ GB thông tin. Nếu toàn bộ lượng dữ liệu đó được ghi lên các DVD, thì số lượng đĩa cần thiết sẽ là 100 tỷ chiếc. Với khả năng tuyệt vời như vậy, chỉ cần 4 gram DNA là đủ để chứa toàn bộ lượng dữ liệu hàng năm mà con người tạo ra. Dự đoán dung lượng sử dụng sẽ tăng 2 lần sau 2 năm, và tới năm 2020 dữ liệu toàn thế giới sẽ lớn hơn gấp 50 lần hiện nay. Rõ ràng nếu tiếp tục sử dụng các sản phẩm lưu trữ điện tử thì sẽ dẫn tới các chi phí rất tốn kém, sự thiếu hụt nguồn cung và tạo ra lượng sản phẩm rác thải cực lớn. Do đó, biến ý tưởng lưu trữ DNA thành hiện thực sẽ giúp con người nhanh chóng giải quyết những vấn đề trên.

Không những có mật độ lưu trữ siêu lớn, các DNA còn có độ bền rất cao: ngay cả trong những điều kiện không thuận lợi, các thông tin trên phân tử vẫn được lưu giữ hàng nghìn năm. Minh chứng rõ ràng nhất cho điều này đến từ các bằng chứng khảo cổ học. Trên các xác ướp 5300 năm tuổi từ thời cổ đại, các mẫu DNA vẫn còn nguyên vẹn. Thậm chí ngay cả những gì còn sót lại của những con voi ma mút ở Kỷ Băng Hà cũng đủ tốt để giúp khôi phục hệ gen của chúng. Các nhà khoa học Nga còn có ý định nhân bản loài vật khổng lồ huyền thoại trong một dự án hợp tác với Hàn Quốc. Tinhte cũng từng giới thiệu với các bạn sự kiện khôi phục lại một loài cây 30.000 năm tuổi từ các hạt được bảo quản trong điều kiện tốt. Hãy thử hình dung xem điều gì xảy đến với các thiết bị lưu trữ như CD hay DVD khi tuổi đời của chúng chỉ vào khoảng 20 năm.

Và thực nghiệm lịch sử tại Harvard


dna-book-640.jpg
Sơ đồ mã hóa/giải mã cuốn sách qua DNA mà các học giả Harvard đã thực hiện

Trong thí nghiệm tại Harvard, thay vì chọn các đoạn DNA dài làm đối tượng lưu trữ, các nhà khoa học sử dụng các chuỗi ngắn hơn. Nguyên nhân ở đây là do rất khó điều khiển và làm việc với các chuỗi dài. Hơn nữa việc ghi dữ liệu trên đó sẽ đẩy các chi phí lên rất cao và dễ bị lỗi. Nhằm thực hiện mục đích của mình, đầu tiên nhóm nghiên cứu chuyển toàn bộ số bản copy của cuốn sách, hình ảnh và lệnh JavaScript sang ngôn ngữ HTML. Bước tiếp theo, họ mã hóa HTML bằng các chuỗi nhị phân với tổng chiều dài là 5,27 triệu trạng thái. Sau đó họ định hình các trạng thái 0 và 1 ứng với các nucleotide. Cụ thể, A và C mã hóa trạng thái 0, còn G và T được dùng để chỉ 1. Mỗi chuỗi DNA ngắn sử dụng sẽ tương ứng với 96 bit dữ liệu và chúng sẽ đóng vai trò như các sector trên các ổ cứng thông thường. Mỗi sector DNA được đặc trưng bởi 19 bit địa chỉ để phân biệt với các sector khác khi nối chúng với nhau. Được biết số sector đã sử dụng để mã hóa toàn bộ các tài liệu là 54.898. Hơn nữa, nhằm đảm bảo quá trình mã hóa trên DNA chính xác, nhiều phiên bản giống nhau của các chuỗi ngắn được tạo ra để so sánh.

Khi các tài liệu được mã hóa hoàn toàn vào các chuỗi DNA ngắn. Nhóm nghiên cứu gắn nó với một vi xử lý có kích thước vài micromet để kiểm tra. Hệ thống này được đưa vào kho trong vòng 3 tháng ở nhiệt độ 4 độ C. Sau đó họ đưa nó trở lại nhiệt độ phòng và nối các đoạn DNA lại để giải mã. Các phiên bản giống nhau của mỗi sector DNA được ráp thử lần lượt và kiểm tra 3000 lần để đảm bảo độ chính xác của thông tin. Nhờ vậy, sau khi giải mã 5,27 triệu bit dữ liệu thì chỉ có khoảng 10 bit bị sai lệnh so với lúc đầu.

Tương lai trong tầm tay

Quảng cáo


Ở thời điểm hiện tại, phương pháp ghi trên DNA chưa thể đè dữ liệu lên các chuỗi đã được sử dụng, nhưng nó sẽ vô cùng hữu ích trong trường hợp cần một thiết bị gọn nhẹ và bền để chứa một dữ liệu lớn. Hơn nữa, công nghệ sinh học phân tử đã cho phép đọc thông tin mã hóa trên đó mà không cần một thiết bị đọc chuyên dụng như các ổ đĩa CD và DVD ở các máy tính hiện nay.

Như chúng ta đã thấy ở trên, mặc dù đã tạo ra nhiều bản sao cho mỗi sector nhưng việc mã hóa và giải mã thông tin trên toàn bộ dải DNA ghép nối vẫn còn một số lỗi. Vấn đề này có thể được giải quyết nếu tăng số lượng bản copy lên thêm nữa. Khó khăn lớn nhất của phương thức lưu trữ sinh học kiểu này là giá thành của nó vẫn còn lớn hơn các thiết bị chứa dữ liệu truyền thống. Tuy nhiên, trong tương lai nó sẽ trở nên cạnh tranh hơn nhiều vì các công nghệ áp dụng cho phép tốc độ giảm giá từ 5 tới 10 lần/năm. Tiến sĩ Sriram Kosuri một trong những tác giả bài báo vừa đăng trên tạp chí Science tin tưởng về hướng đi của nhóm: "Chúng tôi gặp phải một số rảo cản, nhưng đó không phải là điều gì đó quá khó để phải dừng lại". Với lộ trình như vậy, 5 hoặc 10 năm nữa, thay cho những ổ cứng, đĩa quang, usb ... chúng ta hãy chuẩn bị đón chào những thiết bị DNA đầu tiên.

160 bình luận
Chia sẻ

Xu hướng

Đáng được để mắt tới
sangcay
ĐẠI BÀNG
12 năm
@phucziban007 Tôi không biết bạn là ai nhưng tôi nghĩ bạn là một gì đó rất ghê ghớm
mewkuli
ĐẠI BÀNG
12 năm
khiếp, công nghệ phát triển trên mọi lĩnh vực...
chipnho_tnt
ĐẠI BÀNG
12 năm
Khoa học ngày càng phát triển mạnh.
Cái lầy hay à nha. Sau này thông tin của cả thế giới chỉ nằm trong 1thiết bị nhỏ xíu. Cấy vào não nữa là khỏi đi học luôn =))

Gởi từ Cái Cục Gạch Của Tui
@minhchauforever chuẩn k cần chỉnh luôn =)))
uiza thế này hdd, thẻ flash, ram vất đi hết rồi! quả này siêu máy tính khéo giá chỉ bằng mấy cái lap bình thường thôi! anh e bán phá giá máy tính nhanh còn kịp hoho
@nndinhnc_bg nhạt ......................
Lưu trữ và đọc trên DNA - Xử lý dữ liệu trên chip sinh học - Người máy sinh học là khả năng gần như chắc chắc
RedDevil89
ĐẠI BÀNG
12 năm
Công nghệ này sẽ mở đầu cho sự ra đời của 1 Robot sinh học. Tương lai người ta sẽ lấy sao chép thông tin DNA của Albert Einstein kết hợp với Napoleon để tao ra 1 siêu rô bốt đủ sức hủy diệt vũ trụ, hehe, nghe quá đã
@RedDevil89 Trí tưởng tưởng quá phong phú , cũng như phát minh trên quá tuyệt vời vậy . Không chừng ý tưởng điên rồ -> quá đã của bạn xảy ra sự thật 😁
đáng để mũi tới, nhưng....thật khó quá đi mà😁
vumi_89
ĐẠI BÀNG
12 năm
Quá cao thủ, một công nghệ không tưởng.
RedDevil89
ĐẠI BÀNG
12 năm
Hehe, em có cùng quan điểm với bác 😁
vanphuc92
ĐẠI BÀNG
12 năm
kinh khủng quá. công nghệ đang dần trở nên siêu việt, cách đây 5-10năm những thứ đó chỉ có thể nghe và thấy trên những bộ phim viễn tưởng , hay truyện doreamon. hihi :-Đ
Chừ mình mới thấy @@ môn sinh học có giá trị như thế nào đến công nghệ hiện đại @@!, một thời mình ghét nó ..... nhưng nay không còn học nữa rồi 😆
Minimet là đơn vị Hàn lâm nào mà em chưa được biết??? Chắc mình ngu quá
@Airblade14 Hình như là mili mét chứ nhỉ làm gì có mini mét @@
Sau này sẽ tạo ra những con người với những khả năng đặc biệt, ví dụ họ sẽ tạo ra 1 anh chàng tên là Bách khoa Toàn thư, cần gì cứ gọi anh ấy đến anh ấy sẽ tự trích xuất thông tin trong DNA của mình và đọc cho mọi người nghe.
Con người thật là phi thường 😃
Nay mai ta dùng chính DNA của ta làm ổ cứng luôn, ví dụ chép lên trên đầu ngón tay khi cần chỉ đút ngón tay vào lổ là xong.
Thông báo của nhà khoa học, chúng tôi đã mã hoá thành công dữ liệu vào ADN, ( còn việc giải mã chúng tôi ko biết) 😃
@Airblade14 Ở trên giải mã được rồi mà có cả sơ đồ mã hóa và giải mã mà @@
@Airblade14 Sơ đồ mã hóa/giải mã cuốn sách qua DNA mà các học giả Harvard đã thực hiện . Anh chưa xem cái hình ah` @@!
@Airblade14 Ko biết sao 5.27 triệu bit mà tìm dc 10 bit bị sai.nhà khoa học chứ có phải xe ôm đâu
Đúng là Harvard, họ quá giỏi!
axít deoxyribonucleotide là ARN chứ koh phải ADN
@Trung Lê Hiếu Bác phản khoa học đấy ah` @@!
quochung83
ĐẠI BÀNG
12 năm
@Trung Lê Hiếu Cậu Làm Gì Thế?
Acid Deoxyribo Nucleic (viết tắt ADN theo tiếng Pháp hay DNA theo tiếng Anh)
còn ARN là cái này Axit Ribô Nuclêic
@Trung Lê Hiếu Deoxyribonucleic acid (i/diˌɒksiˌrbɵ.njˌkl.ɨk ˈæsɪd/; DNA) is a nucleic acid containing the genetic instructions used in the development and functioning of all known living organisms (with the exception of RNA viruses). The DNA segments carrying this genetic information are called genes. Likewise, other DNA sequences have structural purposes, or are involved in regulating the use of this genetic information. Along with RNA and proteins, DNA is one of the three major macromolecules that are essential for all known forms of life.
DNA consists of two long polymers of simple units called nucleotides, with backbones made of sugars and phosphate groups joined by ester bonds. These two strands run in opposite directions to each other and are therefore anti-parallel. Attached to each sugar is one of four types of molecules called nucleobases (informally, bases). It is thesequence of these four nucleobases along the backbone that encodes information. This information is read using the genetic code, which specifies the sequence of theamino acids within proteins. The code is read by copying stretches of DNA into the related nucleic acid RNA in a process called transcription.
Within cells DNA is organized into long structures called chromosomes. During cell division these chromosomes are duplicated in the process of DNA replication, providing each cell its own complete set of chromosomes. Eukaryotic organisms (animals, plants, fungi, and protists) store most of their DNA inside the cell nucleus and some of their DNA in organelles, such as mitochondria or chloroplasts.[1] In contrast, prokaryotes (bacteria and archaea) store their DNA only in the cytoplasm. Within the chromosomes, chromatin proteins such as histones compact and organize DNA. These compact structures guide the interactions between DNA and other proteins, helping control which parts of the DNA are transcribed.
http://en.wikipedia.org/wiki/DNA
@Trung Lê Hiếu Chú bị say sóng à? 😕

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019