全文検索を完成させてみる。結局「思い立ってから2時間も掛からずに完成した」と言う事か。使い勝手?悪い訳がないだろう?と言う事で。とまむさんですよ。
ぶっちゃけ自分しか使わないだろうと言う事で一応画像フォルダの方にキャプチャ画像を掲載した。使い方が普通の全文検索とは違うが俺にとっては検索しやすい。
順番としては「どの言葉を検索したいのかを決める」「検索したい日記の範囲を決める」「言葉を入力する」「該当する日記だけがオープンされる」と言った段取り。
試しに「ラストイヤー」「範囲は去年の12月から今年の2月」と言う事で入力すると仮定する。そして「3件の日記が該当しましたよ?」と仮定する。
3件か。意外と少ないな。1件の日記に複数回同じ言葉を使っているんでトータルとしては回数が増えるが言及しているのはそれだけ。以上3件を後は
Firefoxのアドオンでも使って特定文字をハイライト化して黄色い背景に赤い文字、にすれば目立ちやすくなりますね。みたいな展開で。
範囲なんだが日時は連続していなくてもオッケー。だから「2004年12月」「2005年12月」「2006年12月」の延べ3ヶ月分だけを選択して
「有馬記念」と打ち込んで検索してみればまぁ言及している日記だけが抽出されて登場してきますよ?と言う事でそう言った流れ。だって普通に考えて7月とかに
有馬記念の話なんてしねぇだろ?するにしてもそんなに大きな出来事としてのお話!って訳でもないから。いわゆる「旬」がどこにあるのかと言うお話で。
例えばインデックス型のcgi検索エンジンだといちいちインデックスを作ったり更新したりする必要がある。「複数回出てくる言葉を全て拾えない」と言う事になる。
「俺の好きな牝馬はヘヴンリーロマンスなんですが特にヘヴンリーロマンスが勝ったレースの中では札幌記念が印象的でさすがヘヴンリーロマンスだと思いました」
と言う文章。ヘヴンリーロマンスの単語は3回出てる。しかしインデックス型の全文検索では最初の1回しか抽出されない。あまり便利では無いなと思ってしまう。
なんて言う事で全文検索の構築が終了いたしました、みたいなそんな近況でも。最初は特定のフォルダに突っ込んで.htaccessで制限しようと思っていたが
それをやるのもめんどくさいので「使う時だけ検索スクリプトのパーミッションを644に変更する」事で妥協。普段は600にしてるからブラウザ経由では呼び出せません。
一応検索スクリプトにはロボット避けのタグも書いてはおいたけどな。行儀の悪いロボットには意味ねぇけど。割と特亜のハイエナロボットの行儀が悪い。
ペットは飼い主に似るんですね♪だとか思ったが。ものすげぇ分かりやすい話だな。もちろん特亜からのアクセスはウザいんで.htaccessで禁止しておきましたが。
「みんな!.htaccessで特亜避けがこれからの常識だよ!」…みたいな展開で。久住辺りのきらりんな声質で読んで下さいな。マジ快適よ?ハイエナが来ねぇと。
特亜のゴキブリっぷりはもう全世界が知ってるから。なんて言うか「常識っしょ?」と言う事で。そんな事して過ごしていた今日のとまむさん。風呂入って寝るわ。