Trong một nỗ lực nhằm lưu giữ lại những nội dung trên mạng Internet, năm 1996, thư viện số Internet Archive đã ra đời. Tính đến hôm 25/10/2012, Internet Archive đã lưu được 10 petabyte dữ liệu, tức là 10.000 terabyte, hoặc 10.000.000.000.000.000 byte. Chắc chắn con số này sẽ còn tiếp tục tăng vì Internet đang ngày càng phát triển với tốc độ nhanh hơn. Hiện tại hệ thống máy của Internet Archive chứa chừng 1 triệu video, và khoảng 1,5 triệu file audio. Nó cũng là “nhà” của ứng dụng Wayback Machine, cho phép chúng ta xem lại giao diện những trang web kể từ năm 1997 (các bạn có thể xem lại www.tinhte.vn vào thời điểm đầu năm 2011).
Mặc dù con số 10 petabyte không là gì khi so với dữ liệu của các “gã khổng lồ Internet” như Facebook (hiện chứa khoảng 100 petabyte hình ảnh và video), nhưng đây cũng là một cột mốc quan trọng đối với Internet Archive. Trong những tháng gần đây, tổ chức này đã mở rộng việc lưu trữ nhiều hơn các dữ liệu truyền thống và gói trong các liên kết BitTorrent để có thể tải về nhanh hơn. Ngoài ra, Internet Archive cũng công bố một gói dữ liệu web dung lượng 80 terabyte, với hơn 2,7 tỉ trang dành cho các nhà nghiên cứu.