- autor, Bena Morrisa
- Rola, Redaktor technologii biznesowych BBC
Rok 2039 może wydawać się bardzo odległy, ale Ian Crawford już go planuje.
Będzie to uczczenie setnej rocznicy wybuchu drugiej wojny światowej, ważnego roku dla mojego pracodawcy, Imperialnego Muzeum Wojny.
Pan Crawford jest dyrektorem ds. informacji w muzeum i nadzoruje projekt digitalizacji ogromnej kolekcji zdjęć, nagrań dźwiękowych i filmów.
Biorąc pod uwagę kolekcję około 24 000 godzin filmów i wideo oraz 11 milionów zdjęć, jest to ogromne przedsięwzięcie.
W okresie poprzedzającym rok 2039 priorytetem będą materiały z II wojny światowej.
Wykonywanie cyfrowych kopii tych źródeł historycznych jest niezbędne, ponieważ oryginały z biegiem czasu ulegają zniszczeniu i pewnego dnia zostaną utracone na zawsze.
„Otrzymując pojedynczy egzemplarz, chcesz mieć pewność, że Twój system przechowywania danych jest niezawodny” – mówi Ian Crawford.
Ilość danych potrzebnych do długoterminowego przechowywania stale rośnie, ponieważ najnowsze skanery mogą rejestrować dokumenty i filmy z dużą szczegółowością.
„Potencjał wzrostu jest naprawdę ogromny” – mówi Crawford.
„Teraz przyglądamy się samym obiektom i wykonujemy skanowanie 3D, co pozwala na utworzenie bardzo dużych plików”.
Ten zalew danych nie ogranicza się do muzeów; zalewa go wszędzie.
Firmy kupują więcej miejsca na kopie zapasowe danych, szpitale potrzebują miejsca do przechowywania dokumentacji, a rząd potrzebuje miejsca do przechowywania coraz większej ilości informacji.
„Nadal generujemy ogromne ilości danych” – mówi Simon Robinson, główny analityk w firmie badawczej Enterprise Strategy Group.
„W przypadku większości organizacji – to jest bardzo zróżnicowane – ilość danych podwaja się co cztery do pięciu lat, a w niektórych branżach rośnie znacznie szybciej” – mówi.
Dane, które trzeba przechowywać przez długi czas, nie są przechowywane w tradycyjnych centrach danych, tych ogromnych magazynach, ze stojakami serwerów i migającymi światłami. Procesy te są przeznaczone do danych, do których należy uzyskać dostęp i często je aktualizować.
Zamiast tego najpowszechniejszą metodą długoterminowego przechowywania danych jest nagrywanie na taśmie. W szczególności format znany jako LTO (Linear Tape Open), najnowsza wersja o nazwie LTO-9.
Same taśmy niczym nie różnią się od starych kaset VHS, są jednak nieco mniejsze i bardziej kwadratowe.
Wewnątrz kasety znajduje się kilometr taśmy magnetycznej, mogącej pomieścić 18 terabajtów danych.
To dużo – tylko jeden pasek może pomieścić taką samą ilość danych, jak około 300 standardowych smartfonów.
Imperial War Museum w Duxford korzysta z systemu taśm firmy Spectra Logic. Maszyna wielkości mniej więcej dużej szafy może pomieścić do 1500 kaset LTO.
Te systemy LTO dominują na rynku długoterminowego magazynowania. Istnieją już od kilkudziesięciu lat i udowodniły, że są niezawodne.
Są też bardzo tanie, co jest istotne, gdyż klienci z reguły chcą płacić jak najmniej za długoterminowe przechowywanie.
Niektórzy są jednak przekonani, że można to zrobić lepiej.
W dawnej fabryce tapet w Chiswick w zachodnim Londynie start-up opracowuje system długoterminowego przechowywania, który wykorzystuje lasery do wypalania drobnych hologramów w światłoczuły polimer.
Dyrektor generalny Charlie Gale zwraca uwagę, że w przypadku taśmy magnetycznej dane można przechowywać jedynie na powierzchni, podczas gdy hologramy mogą przechowywać dane w wielu warstwach.
„Można wykonywać czynności zwane multipleksowaniem, polegające na umieszczeniu wielu zestawów informacji w jednym miejscu. To naprawdę supermoc naszego działania. Uważamy, że możemy umieścić więcej informacji na mniejszej przestrzeni niż kiedykolwiek wcześniej” – mówi.
Bloki polimerowe HoloMem wytrzymują ekstremalne temperatury bez uszkadzania danych – od -14°C do 160°C.
Dla porównania powinna to być taśma magnetyczna Przechowywać w temperaturze od 16°C do 25°COznacza to znaczne koszty ogrzewania i chłodzenia, zwłaszcza w krajach o ekstremalnych temperaturach.
Taśmę również należy wymienić po około 15 latach, natomiast polimer jest dobry na co najmniej 50 lat.
Pan Gale zwraca uwagę, że ponieważ laser zmienia chemicznie polimer, po zapisaniu danych nie można manipulować.
Prototyp systemu Holomem, który będzie mógł przechowywać i pobierać dane, będzie gotowy jeszcze w tym roku.
Gale twierdzi, że koszt systemu został utrzymany na niskim poziomie dzięki zastosowaniu standardowych, powszechnie dostępnych komponentów, w tym laserów, dlatego ma pewność, że HoloMem będzie w stanie dorównać kosztom taśmy magnetycznej lub je przewyższyć.
HoloMem będzie musiał być konkurencyjny, ponieważ na rynku pojawia się ogromny konkurent.
Za pośrednictwem swojego działu badawczego Microsoft opracowuje własny system długoterminowego przechowywania danych.
Podobnie jak HoloMem zdecydowałem, że czas odejść od taśmy magnetycznej, ale Microsoft jako materiał do przechowywania wybrał szkło.
System o nazwie Project Silica wykorzystuje potężne lasery do tworzenia drobnych zmian strukturalnych w szkle, zwanych wokselami, które można wykorzystać do przechowywania danych. Woksele są niezwykle małe i można je układać warstwami.
Microsoft twierdzi, że kawałek szkła o grubości 2 mm i wielkości płyty DVD będzie w stanie pomieścić ponad siedem terabajtów danych.
System przechowuje szklane panele na stojakach, do których dostęp mają małe roboty przypominające kraby, poruszające się po szynach.
Tanie i trwałe szkło to atrakcyjny nośnik danych, mówi Richard Black, który kieruje projektem Silica.
„Jest wysoce odporny na temperaturę, wilgoć, cząstki i pola elektromagnetyczne” – mówi Black.
Potencjalnie mogłoby to zachować dane przez setki, a może tysiące lat.
Taki system mógłby pewnego dnia zostać zintegrowany z ogromną firmą Microsoft zajmującą się przetwarzaniem w chmurze, Azure.
Jest to jednak naciągane, ponieważ system ma przed sobą lata rozwoju.
W Duxford Imperial War Museum, podobnie jak wiele organizacji, eksperymentuje ze sztuczną inteligencją. Niedawno sprawdzili, czy sztuczna inteligencja potrafi rozpoznać różne modele Spitfire’a na zdjęciach z katalogu obrazów.
Crawford uważa, że sztuczna inteligencja może być niezwykle przydatna w katalogowaniu jego biblioteki cyfrowej, co zajęłoby ludziom setki lat.
Zdolność sztucznej inteligencji do przeglądania ogromnych ilości danych sprawiła, że ich zachowanie stało się jeszcze ważniejsze – może czaić się w nich coś cennego.
„W przeszłości firmy archiwizowały dane na wypadek, gdyby były potrzebne” – mówi Robinson. „Teraz istnieje prawdziwy powód biznesowy, dla którego chcą wrócić i przeprowadzić analizę”.