ココログからWordPressへ

実質的な最初の記事が2009年11月01日。
最後の記事が2013年12月31日。
そして本日は2021年07月20日。
実に7年超の放置となってしまったcocolog。

更新しないままでもタダ(無料)では無く、229件の記事をただただ消すのも踏ん切りが付かずにずるずると7年超。

そんな7年の間にいろいろと環境が変わり、仕事上でWordpressを使う機会があって、いろいろなテーマを見ている内にこれなら移転出来るのでは? と言うことでようやく移転を決意する。2010年春頃に。

思い立ってから実に1年掛けてやっとこさ移転が完了したので、折角だからその奮闘ぶりを最初の記事にしてみる。

ココログにアクセス

1年ぶりにココログにアクセス。
7年も放置されているにも関わらず、アクセス推移を見てみると意外な事にほぼ毎日数件レベルでのアクセスがある。

田舎のただの一般人なおじさんのページにアクセスがあるのは嬉しくもあり勿体なく感じたりもする。

そして本題。
ココログ上の記事をどうにかする為「設定」にアクセス。
エクスポートがあったのでこちらにアクセス。

出力範囲は書き始めから最後の記事まで全部。
友人たちとのやりとりがただただ消えるのも忍びないのでこの際にコメントも含める。

エクスポートを実行するとほんの数十秒でダウンロードが完了。

その容量僅か2Mbytes。
230記事書いて2M(2,299,205bytes)は多いのか少ないのか。
無理矢理全角換算すると14万文字。
制御用の半角文字やらなにやらが超どんぶり勘定で半分あったとしても7万文字。
なかなかピンとこない数字ではある。
一昔前の美少女ゲームと呼ばれたアドベンチャーゲームの場合、攻略キャラが3人程度でテキスト状態で2M近くの容量だから、シナリオライターの人たちは僅か1~2ヶ月でこの量を書き切る計算になるから凄い。
(余談:一番テキスト量の多いゲームで10Mの物があった。さすがに書き切るのに1年ほど掛かっているのを隣で見ていた思い出。)

【核】の部分は取得できたのでcocologでの作業は終了。

WordPressにアクセス

WordPressの環境はレンタルサーバーのサービスから自動インストールの上、適当にスキンを選んで初期設定済み。
あとはcocologでエクスポートしたテキストファイルをインポートするだけ。
とはいえ初期状態ではcocologの「MT(Movable Type)形式」に対応せず、対応したプラグインを適用して初めてインポートが可能となる。

今回使用したプラグインは「Movable Type・TypePad インポートツール」。

最終更新が5年前となっているけど、cocolog側で特殊な仕様が無い限り問題ないだろうとそのまま使用。

【ダッシュボード】→【ツール】→【インポート】から早速インポーターを実行。

cocologから出力されたファイルを選択してインポートを実行。

完了!

新たなTOPページを開いてみると、全ての記事とコメントでのやりとりがそのまま復活。

今見ると恥ずかしい記事の装飾もそのまんま復活。
貼り付けてあった記事中の写真も、「そのまま表示」「クリックで拡大」などもそのまま機能。
かなりお手軽に移行が完了した。

どういう構造か解らないけど、画像もそのまま引っ張ってくるのは凄い。

と思った時点でblog移行の最大の問題点に気付く。
画像のアドレスをみてみると・・・
https://lakesidewalker.cocolog-nifty.com/photos/uncategorized/txt100101b01.jpg】
当たり前だけど、元のcocolog上のアドレスを指している。
移行が完了したと思ってNiftyを解約したら全てが水の泡になるところだ。

cocologから画像ファイルの抽出

再びcocologにログイン。
メニューから「マイフォト」を開く。

blogのシステムからアップロードされた画像ファイルは1029枚。
ここもエクスポートをしようと思うも、この「マイフォト」からは一括ダウンロードが出来ない。
一覧から写真を選ぶも1枚1枚の詳細に入ってしまってここからもダウンロードは不可。

「フルサイズ表示」から表示されたものをコンテクストメニューから「画像の保存」を選ぶのはあまりに非現実的過ぎる。
自分でアップロードしたはずがなんとも不自由。

過去にアップロードした記事は、フォルダ分けして写真と共にだいたい保管してある。
それを利用して・・・と、思ったものの、古いものは10年以上も前の記事。
残念ながら半分も残っておらず。

いろいろ考えた結果思いついたのは「ダウンローダー」の利用。
まさか自分のサイトで使う事になるとは思わなかった!

エクスポートされたテキストファイルを対象に「抽出」を実行。
文字列は【 <img  】。
imgタグの行で指定されている文字列を全て抽出する。

抽出量は1143行。
なから画像総数に近い数量。
同じ画像を2回以上使う事もあるからそれほど遠い数字では無い。

このままでは使い物にならないので成形していく。
http:】をキーワードに【<改行>http:】に置換。
.jpg(gif)(png)】をキーワードに【.jpg(gif)(png)<改行>】に置換。
全体を昇順ソート。

画像ファイル直撃のURLリストが完成。

このリストをダウンローダーに放り込む。
今回使ったのは未だに生存が確認出来た【Irvne】。
適当にインストールしてあとはリストをインポートするだけで実行出来た。
細かい設定とかいろいろあるかもしれないけど、今回は特に必要ないんで触らず。

ダウンローダーによって無事画像ファイルのダウンロードが完了。

懐かしさを感じつつ1枚1枚画像を見ていったときに大問題が発覚。
画像サイズが小さい。
元々blogにアップしていた写真は、2:3または3:2の写真比率で900px × 600pxに統一。
サムネイルのサイズはその1/3になる300px × 200pxに指定。
ダウンロードされたファイルはこのサムネイル側のサイズの物。

これにはパニック。
エクスポートされたテキストファイルをよくよく追いかけてみるとcocologの独自仕様にやっと気付く。
画像ファイルのURLはこの3種類の形式があった。
http://lakesidewalker.cocolog-nifty.com/photos/uncategorized/2009/12/02/09111603.jpg
http://lakesidewalker.cocolog-nifty.com/blog/images/2009/11/30/09110401.jpg
http://lakesidewalker.cocolog-nifty.com/.shared/image.html?/photos/uncategorized/2009/11/30/09110401.jpg
フルサイズの画像データは3番目の形式のアドレス先にあって、サムネイルサイズの画像が自動的に2番目の形式のアドレス先に作られていた。
改めてアドレスを抽出し直すことで、サムネイルも含めて全ての画像のダウンロードが完了。

WordPress側の仕様は良く分かってないけど、少なくとも全く同じファイル名で2つの画像が用意されてる以上同じように指定しないと正常に動作しない事が予想された。
3番目の【.shared】と【image.html?】というURLの記述法が意味不明でうまく置換する事が出来ず、1記事ずつ画像ファイルを貼り直す作業をすることにした。

が、記事数の問題なのか1記事1記事の移動のレスポンスが悪く、移動・画像選択などの操作だけで1記事あたり5分近く掛かってしまった。
30記事ほど根気よく修正したものの、終わりが見えず2020年の春先に更新作業を断念。

画像ファイルの移転

それから1年超。
いよいよもってblogをどうにかしたいと再びエクスポートファイルと対峙。

正直なところ感想は1年前と同様。
結果、URLの記述方法とかタグの使用方法とか、難しい事を考えるのを一切やめて力業に頼る事にした。
http://lakesidewalker.cocolog-nifty.com/photos/uncategorized/
http://lakesidewalker.cocolog-nifty.com/blog/images/
http://lakesidewalker.cocolog-nifty.com/.shared/image.html?/photos/uncategorized/

この3つのアドレス内の画像に対し、それぞれ頭文字を付けてバラバラのファイルとして扱うことに決めた。
こうすることでファイル名がかぶっても上書きされる事が無く、html側からも指定先のファイルがあるからunknownになる事が無い。

こうして元々1029枚だったはずの画像ファイルは1.5倍の1500枚ほどに増え、ファイル名を再振りすることで解決。
http://lakesidewalker.cocolog-nifty.com/】を【http://cake.rusk.to/lakesidewalker/】に置換して再度インポートすることで無事画像の移転が完了。

抽出と置換を駆使して二日ほどで全移転が完了。

忘れ物は無いかとエクスポートファイルに対して改めてキーワード【cocolog】で抽出。

抽出件数 130件

まさかの事態。

画像ファイルに気を取られていたけど、blog内リンクはまだ他にもあった。
それは「パーマリンク」。

パーマリンクの修正

いろいろと検索して、Wordpressのインポートファイルでのパーマリンクの指定が無いか調べるもどうにも無さそうな事が解ってきた。
エクスポートされたファイルの中にも、cocolog上でのパーマリンクの情報は入っていない。
WordPress側の命名ルールをみると、タイトルを参照するか日付かナンバリングかで、エクスポートファイル内に記述されたパーマリンクを置換する術はどうにも無かった。

抽出件数は130件ほどだけど、1記事あたりで最大10件近くリンクされてるパターンもあって、実質は50記事ほどしかない。
最後の最後で本当の力業により1記事ずつ手動で貼り直し。
画像の抽出やら置換やらの数倍の時間を掛けて今度こそ完了。

Nifty cocologから

WordPressへ移転完了

画面周りがさみしいからデザインを整えつつ徐々にLAKESIDEWALKER色に染めていくとしましょう。

コメント