とまむさんの日記を全文検索したいなぁ。と言う事は前からもう書いてきた。色々な方法を試してみたんだが正直どれもしっくり来ない。
例えば「ぐーぐるさんのサイト内検索を利用する」「msearchの様なインデックス型の検索エンジンを設置する」「クローラー型の検索エンジンを設置する」
と言う風に。しかしどれもパッとしない。俺は「普通のサイト構成」は大嫌いなんで。もっと「ドカーン!」と来る様な全文検索が欲しい。
そう言う事を思って「うーんうーんうーんうーん」みたいな事でも思ってる。ぐーぐるさんのサイト内検索は反映されるのが遅い。インデックス型の検索エンジンは
そのインデックスの量が膨大になってしまうので却下。クローラー型の検索エンジンはいちいちファイルを調べに行くと言う事でサーバに負荷が掛かるので却下。
うーんうーんうーんうーん、みたいな事でも思ってなーにーかーなーいーかーなー?的な事を思って風呂に入ってピコーンと思いついた。これだー!みたいなお話で。
って言うか技術的な説明をした所で意味も無いんですが。とりあえず概要だけでも書いておくか。以下説明。って言うかかいつまんでバリバリ書いておく。
「即座に結果が出る全文検索」で無いと使い勝手が悪い。例えばCGIを使っての検索だと検索中〜みたいな感じで結構待たされる。俺としては待たされるのが嫌い。
「ストレインと打ち込んで検索した場合該当する言葉に色をつける事が出来る」で無いとどこにその単語があるの?と言う事でいちいち探さなければいけない。そして
「いちいち全ての日記を検索するのもアホなので自分がこの期間の日記だけ探したい、と言う様な指定が出来る」と言うのが1番大事。例えばストレインと打ち込んで
検索に引っかかるのはつい最近のお話だから。例えば2004年の日記の中をストレインって打ち込んで検索して結果が出ると思いますか?出ないでしょ。
出るとしても別の意味で使った展開、となるのがオチ。俺の中での日記のトレンド、みたいな物は隆盛がある訳なんだから特定の期間だけで検索を掛けたい、と。
後は「ログが増えてサーバを圧迫する様な事にならない」「転送量を抑える事が出来る」「今の日記ログを殆どいじらないで運用出来る」と言う事でそんな条件。
結局括弧で括った条件の数は全部で5つか。まぁ全ての条件に当てはまる様な全文検索が出来ますよ?と。これから本格的な作業に入る訳だが。時間も掛かりそうだ。
そう思うだけ。一応書いておくとPHPとJavascriptを使って構築する。ただなぁ。転送量に関しては1回や2回程度の検索だったら問題も無いんだが
不特定多数の人間が一気にバーッと検索掛けやがったら間違いなくサーバに負荷が掛かって仕方がないわこれ。自分専用オンライン検索、みたいな扱いでいいや。
元々このサイトはとまむさんが自分で使う為に作っている訳だからな。トレンドの隆盛に関しては自分の知ってる物に関しては「あぁあの時期だな」と言うのが分かる。
例えばヘヴンリーロマンスで検索掛けようとした場合この日記で数多く取り上げられているのは2004年の阪神牝馬ステークス。
それから2005年のクイーンステークスと札幌記念。そして2005年の天皇賞秋。この辺が特にドトーンと突き抜けているでしょう?と言う事でその辺り。
トレンドの隆盛で自分が知らない物に関してはGoogle Trendsでも使って簡単に調べておきますか。みたいなお話で。例えばGoogle Trendsで水銀燈と打ち込むと
2005年の後半にババーン!と言う様な勢いで急上昇している事が良く分かる。後は低空飛行なのにこの時だけ10倍近く跳ね上がっていると言うこの不思議。
Google Trendsは割と面白いよ?とか言う事で。だからオープンにしたら転送量食うわこれ。余計な転送量はカットしたくてしょうがないんで。まぁ普通に
.htaccessでパスを掛けての利用になりそうです、とだけ書いておきますか。まぁいいや。自分以外の人間が使うとは到底思えませんが。ただとまむさんとしては
技術的にはこう言う事も出来ますよ?と言うのを誇示したいだけなんで。もうね。技術的に無理、と思われる事がすごくすごーく嫌すぎるぅ!と言うだけのお話なんで。