あの地震と津波で、自宅でバックアップってことが 意味がないこともある。 という事実を、多分日本中の人が思い知ったと思うんだよね。つまり地政学的リスクというやつ。もうそろそろ風化しているのが悲しいが。
ローカルバックアップさえ行わなくてデータを飛ばし続けている俺が、いまさら地政学的リスクなどと言うと、一生ならぬ一笑にふされるであろうが.....最近自分より大事な人ができたので少し真面目に考えてみよう、というのが本稿の主旨である。なお、ここでの「一生」とは「あと高々30年」という前提にたつ。
先に結論を書くと、2013年時点では、 Amazon S3とGlacierの自動連携を使うのが最適 という結論に達した。以下に理由を長々と述べる。
この話では 自宅には1次変更先としてのHDDを残しておく のは前提としてある。それをRAID NASで残しておくのも一考に値する。
BUFFALO テラステーション ネットワーク対応HDD(NAS) 2TB TS-WX2.0TL/R1 |
しかしバックアップメディアとしては....20MBのSASIインタフェースHDDから20年以上HDDを使い続けているが、HDDはとにかく壊れる。 さらに「重くて持ち運びにくい」ので、震災はおろか単なる引っ越しでも壊れる可能性がある。
最近、俺の親も含めてメモリカードは壊れないものだと考えている人が多いようだが.....SDカードやパソコンのSSDで使われている フラッシュメモリは早ければ5年めくらいから揮発し始める。 ただ、最初からフラッシュメモリのチップには、ECCなどのエラー訂正回路が入っているので、多少抜けても訂正限界までは大丈夫というだけの話。たちの悪いことに、フラッシュメモリの微細化や多値化(SLC, MLC, TLC)にあわせてドンドン悪化する。だから今でもわざわざSLCチップ採用のSSDが売られているくらいだ。
誰もその日を迎えていないが30年は保たない構造だろう(もちろん途中で全コピーし直すと寿命は伸びる)。
どう考えても光学メディアは論外 だろう。だいたいDVD-R, BD-Rあたりは有機色素を採用しているので、日光を1日当てただけで半分は 分解 してしまうようなしろもの。BD-REやMOドライブなどの相変化メディアは100年くらい保つと言われているが「30年後、光学ドライブ手に入るのか?」で全て論破。なんせロジテックが2013年に「最後の出荷MOドライブ59800円」 をやったくらいである。今でもMOドライブを使い続けている人がいるのは、ひとえに「コピーが面倒くさい」に尽きると思うんだよね。一瞬で吸い出して業務システムごと移行できるなら誰でもやると思うんだ。
まあ、ネットにコピーしておけば、自宅が全壊しても大丈夫。逆に単体メディアにないデメリットは 「容量」「価格」「サービス継続性」 だ。ここではどうしても失いたくない個人データを400GB前後と定める。欲張るとキリがないわけだが、ぱぱネット(仮)でいうと、あいあんさん当たりはデジカメのデータだけで200GBはあるはず。
容量だけで料金を比較してみるとこうなる。
Google Drive | DropBox | SkyDrive | Pogoplug family PRO | |
年間料金(1ドル95円) | 57000円(1TB) | 47405円(500GB) | 19000円(100GBx4) | 9980円(1TB*) |
いやー...改めて表にするとDropbox高いね。その分、高性能の差分クライアント、ファイルの履歴管理で捨てたファイルでも戻せるとか、いろいろ特徴はあるのだが、バックアップ先としては中々キツい金額だ。30年間に料金は下がって行くだろうけど。
この中ではPogoplugが一番良さそうに見える。しかし、Pogoplugはサービスの改変を何度も繰り返して非常に分かりにくいサービスになっている(日本語のページも出来がよくない)のでまとめると....
おお!これは良さそうじゃないか!........と思いますよね。基本は自宅にデータがある、というモデルにも沿っているし、何よりクラウドの維持費が安い。しかし....30年と言わず
という激しい疑問がある。このサービスを、Linuxデバイスの派生品としてPogoplug Classicの頃から眺めていた俺の正直な感想。10年後、津波に流された後で、同じデバイスが手に入り、間違いなくデータを復旧できる、という確信が持てない。
いっそ それならAmazon Glacierを直接使えばいいんじゃね? という結論にたどり着く。
Amazon GlacierというのはAmazon が提供しているバックアップ用のサービス。 グレイシャー(Glacier)とは氷河のこと。そこに貯蔵庫(Vault)を作ってデータを貯める。アーカイブの平均年間耐久性が 99.999999999% となるように設計され、北米、北欧、日本のリージョンに多重バックアップされる。料金は計算が難しいが、 400GBを貯めるだけなら年間4650円($48) である。
99.99.......%ってあんた、間違いなく俺が手違いで消す確率の方が高いわ!
ただ、デメリットもあって....
ということ。まあ最初の2つはいいけど、くせ者は最後だなあ。 実は、Pogoplugをはじめ、Glacierを簡単に使えるサービスが売られているのだが、どんな名前のファイルをいつバックアップしたか?というメタデータが(Pogoplug社に)牛耳られるってこと。だからサービスの継続性が問題になるわけ。
ここで、あえて利便性を捨て、面倒でもAmazonを直接使うというのは、サービス継続性ではAmazon単体を使うのが一番ベターな解だなあと思う。 Amazonは既に「本のオンラインストア」ではなく、東京証券取引所やNASDAQも使っている、Amazon Web Servicesという世界最大のネットサービスを運営する企業であるから。 そして、そのネットワービスを外部に解放し、自社は自社サービスとして積極的に活用(ドックフードを食う、と呼ばれる)しているのだから。
長くなったので使い方は明日以降。
_ .....というわけで死屍累々の状況であった。 正直何の技術的工夫もない「ソラ箱」あたり はすぐに死ぬと思っていたけどクライアントアプリきちんと作ってた ZumoDriveまで終わるとは思ってなかった。オンラインストレージは淘汰が進んでいる。
別に永遠に保つ必要はないんだが(乗り換えるので)、 少なくとも自サーバの寿命よりはサービスの寿命の方が長くないとなあー。
アカウント作成の流れ(http://aws.amazon.com/jp/register-flow/)を 参照して、AWSのアカウントを作成する。最低限必要なのは、
身元確認は面倒だが仕方がない。
マネジメントコンソール(http://aws.amazon.com/jp/console/)にアクセス。 Amazon S3のアイコンをクリックする。最初はバケット(フォルダのようなもの)が ないと思うので適当に名前をつける。ここではto.papa.homeとした。
元々S3はWebサーバとしても使えるストレージなので、特定のバケットに対して Glacierに凍結貯蔵するというルールを追加する。
今回の設定ではS3にコピーしてから1日(*)くらいは自由に出し入れできるが、 それ以上経つとGlacierに凍結されるという設定にした。
なお、Expirationは一定日時経ったら削除する、というルールなので 絶対に設定しないように。これは例えば増え続けるアクセスログを溜め込みすぎないように 古いものから捨てるときに使うもの。
一旦S3にコピーすることでS3のストレージ料金がかかることが考えられるが、 正直誤差の範囲内であろう。それよりもAmazon本体にファイルのメタデータの 管理を委譲できる利益の方が遥かに大きい。Amazonさえ潰れなければ データを取り出すことはできるという1点において。
バケットを選択してUploadボタンをクリックするとダイヤログが出てきて、 ブラウザからファイルをアップロードすることができるが、ファイルが 多いとやっていられないと思うので外部クライアントを使う方法を紹介。
AWSはクライアントに直接アカウントとパスワードを指定せず、 アクセスキーとシークレットキーを書き込むことでアクセスできるようになる。
アカウントアクティビティ⇒ セキュリティ証明書⇒アクセス証明書とたどり( https://portal.aws.amazon.com/gp/aws/securityCredentials) アクセスキータブからアクセスキーIDとシークレットアクセスキーをコピペすればOK。
あたりが有名なクライアント。
どうも私の場合はきっかり1日ではなく、 1日半くらいしてからStorage ClassがStandardからGlacierに変更された。 ちょっとヤキモキしたのは事実だ....
みんなが一番気になる料金。今回使ったS3/Glacierは完全にS3に統合されているので、 GlacierではなくS3の料金表をみてみる(http://aws.amazon.com/jp/s3/pricing/)。
PUT、COPY、POST、または LIST リクエスト $0.005 1,000 リクエスト当たり Glacier アーカイブおよび復元リクエスト $0.05 1,000 リクエスト当たり
つまり、ファイルを1000個アップロードすると$0.01かかる計算に。 個人の写真アーカイブなど高々10万枚くらいだろうから$1ってこと。 でも 10万個に復元リクエスト出して5時間待ってダウンロード は あんまりやりたくないので(汗;)ある程度の単位でtar.gzなどで固めておくのが セオリーかと思います。 どうせなら写真の重複等も取り除いておいた方がよろしいでしょうな。
私は結婚式の写真とiPhotoのoriginalを圧縮したものをアップロードし、 61GiBほどになりました。ここで Glacier料金表(http://aws.amazon.com/jp/glacier/pricing/)をみてみる。
ストレージ料金表 $0.01 GB あたり/月
61GiB置いておくだけなら毎月$0.61 = 57.95円で済む .....はずなのですがはてさて(^^;
photomgrは、写真の重複を削除し日付ベースのファイル名にコピーし直すコマンドラインツールです (ダウンロード:photomgr_20130620.tgz) 使用について起きたファイル喪失、装置の故障などの損失について、私は一切責任をもちません。 まあ使う人もいないでしょうが、必ずバックアップをとってから実行してね。
% perl photomgr.pl [-srcdel] [-lazy 0.8 .. 1.0] 入力ファイルリスト 出力ディレクトリ
そうだ!写真を整理しよう! と思って、 自分好みの命名方法になるようなソフトを探しましたが、無かったので作りました。
なお、画像比較アルゴリズムはこちらのブログをコピペしました(http://blog.vg4.net/archives/1318891.html)。 ヒストグラムのみの比較なので全然違う画像が類似度1.0と判定されることがあるので、 今回は撮影日が衝突したもの同士のみを比較しています。 Perl Imagerが死ぬほど遅いので画像の縮小だけconvertを使っています。
_ 通りすがり [記事とは全然関係ないのですが、ずっとrssリーダーでぱぱネットを読んでいました。最近、ぜんぜん更新されないなぁと思っ..]