Jak archiwizować dane
Kopia zapasowa – rzecz wydawałoby się obligatoryjna każdego użytkownika komputera, w praktyce wykonywana jest niezwykle rzadko lub co gorsza nawet wcale. A jeśli już, to najczęściej niedbale i do tego na nośniku, którego trwałość jest co najmniej dyskusyjna. Wynika to głównie z lenistwa i braku wiedzy na temat używanych technologii.
W niniejszym poradniku przedstawię sposób organizacji danych, którego sam od lat używam przy archiwizacji, wraz z krótkim opisem nośników (a jakże - optycznych) i metody na dodatkowe zabezpieczenie ich zawartości.
„Pokaż mi swój pulpit a powiem ci kim jesteś.”
Ogólnie wiadomo jak wygląda, przechowywanie danych u typowego Kowalskiego. Najczęściej są to Moje Dokumenty w których znajduje się niebotyczny bałagan włączając w to - czy nawet szczególnie uwzględniając - Pulpit. ;) Mnóstwo losowo ponazywanych folderów, zdjęć, dokumentów, programów z obowiązkowo kilkoma kopiami, ze skrótami prowadzącymi donikąd, „pendrakowymi” malware etc.
Aby wykonać jakąś sensowną kopię takiego rozgardiaszu, trzeba go najpierw uporządkować. Oczywiście najlepiej od samego początku dbać o porządek, ale niektórzy ludzie nie potrafią go utrzymać nawet w swoim pokoju, więc... Jest wiele „szkół” jak taki porządek powinien wyglądać. Osobiście jestem zwolennikiem oddzielania prywatnych danych od systemu operacyjnego (dlatego, aby w każdej chwili, w razie np. infekcji móc bezboleśnie przywrócić obraz partycji i w kilka minut zapomnieć o problemie). W Linuksie jest to łatwe, wystarczy osobna partycja dla home, w Windows niestety nie da się oddzielić katalogu użytkownika inaczej jak dowiązaniem symbolicznym - choć biorąc pod uwagę tonę śmieci jakie ten system gromadzi, najlepszym rozwiązaniem jest całkowita rezygnacja z przechowywania tam swoich danych na rzecz innej partycji lub nawet dysku. Same dane należy dzielić nie tylko tematycznie, ale też patrząc pod kątem ich ewentualnej kompresji. Osobno filmy i muzyka, osobno programy, dokumenty, projekty graficzne 2d/3d/cad itp.
„Pakować czy nie pakować? O to jest pytanie.”
Wykonując kopię, dobrym pomysłem jest uprzednie spakowanie danych, czyli ich kompresja. Jeśli do którychś bardzo rzadko zaglądasz, to można kompresować pliki już uprzednio skompresowane (np. pliki *.mp3, *.ogg, *.jpg, *.png, *.avi, *.mkv, *.mp4, *.vob). Oczywiście wówczas już bez kompresji (która paradoksalnie w szczególnych przypadkach może wpłynąć na zwiększenie wielkości pliku)! Co więc daje użytkownikowi takie „okontenerowanie”? Przede wszystkim kontrolę integralności danych wewnątrz archiwum, zmniejszenie ilości plików do np. przesłania czy nagrania i ewentualną ochronę przed niepowołanymi osobami. Pakując pliki użytkownik może nieraz zaoszczędzić blisko 60% pierwotnego rozmiaru, a w skrajnych przypadkach gdzie powtarzalność jest duża, nawet i 90%.
Wielu niedzielnych użytkowników komputera nie pakuje plików przez obawę utraty np. na jakości, słysząc o tzw. „kompresji stratnej” i „bezstratnej”. Tak naprawdę nie ma czegoś takiego jak kompresja stratna, ponieważ nie miałaby żadnego sensu (dane byłyby uszkodzone i nie do odtworzenia). Niestety pojęcia te zdążyły się spopularyzować i często są używane np. przy zmianie formatu graficznego na inny, gorszy (np. JPEG). Nie jest to kompresja tylko zmiana sposobu zapisu, redukując zbędne w założeniach tego formatu, dane – stąd mniejszy rozmiar i gorsza jakość). A więc nie ma to nic wspólnego z tzw. pakowaniem!
Do tej roli proponuję 7-Zip w wersji 9.20 (nowsze to wciąż, jak sam autor zwraca uwagę, wersje beta, a więc rozwojowe, którym z zasady nie powinno się ufać). 7-Zip jest darmowy, włączając w to nawet użytek komercyjny. Do tego na przestrzeni wielu lat został przetestowany przez setki tysięcy użytkowników. Interfejs co prawda nie wygląda zachęcająco: sprawia wrażenie pozornie skomplikowanego i może przez to nie budzić zaufania. Mimo wszystko daje użytkownikowi sporo kontroli nad tworzonym archiwum, zaś sama aplikacja wciąż jest jedną z najlepszych w swojej klasie.
Dlaczego nie popularniejszy i dynamicznie rozwijany WinRAR? Dlatego, że nie jest darmowy, nie oferuje lepszej kompresji danych i w mojej ocenie użytkownik nie potrzebuje, informacji ze strumieni NTFS, nie potrzebuje też żadnych tzw. danych naprawczych (o to powinien dbać np. system plików lub sam użytkownik o czym więcej w dalszej części poradnika) itp. unikalnych dla tego oprogramowania funkcji.
Format archiwum jaki należy wybrać, to oczywiście 7z z metodą kompresji LZMA2 i jej poziomem ustawionym na Ultra (lub bez kompresji jeśli wiesz, że nic na niej nie zyskasz lub gdy zyskasz zbyt mało w stosunku do czasu jaki trzeba poświęcić na rozpakowanie). Daje to najlepsze rezultaty upakowania danych w większości przypadków. Wielkości słownika i słowa można zostawić domyślne (wpływają na ilość potrzebnej pamięci operacyjnej przy wypakowywaniu, nie wpływając znacząco na prędkość pakowania). Liczba wątków zależnie od ilości rdzeni jakimi dysponuje twój procesor. Jeśli potrzebujesz, możesz wybrać wielkość woluminów, czyli co ile 7-Zip ma dzielić archiwum na kolejne części (czego akurat nie polecam ponieważ w razie uszkodzenia kontenera trudniej jest odzyskać dane, nawet w archiwum nieciągłym).
Po kliknięciu w przycisk OK, rozpocznie się pakowanie. Nie zapomnij później przetestować archiwum (skrót również pod ppm w menu kontekstowym).
Niestety na Linuksie nie ma GUI do 7-Zip’a (przynajmniej oficjalnego), ale z powodzeniem można posłużyć się linią poleceń lub nawet napisać skrypt, który użytkownik wywoływałby z poziomu managera plików (np. Nautilusa, Nemo itp.).
W ostateczności można użyć File Roller, który jest bardzo ubogi, ale za to jest prosty w obsłudze i świetnie integruje się ze środowiskiem. Jeśli chcesz spakować bez kompresji, użyj formatu *.tar. Jeśli chcesz kompresować, ale zależy ci na zachowaniu np. atrybutów pliku wybierz *.tar.7z.
Poniżej przykład środowiska graficznego Cinnamon, managera plików Nemo i File Roller.
Komentarze