Ra266導入記録7−1:IIS編
2004.7.17
 Windows2000に標準添付されているインデックスサービスとIIS(インターネットインフォメーションサービス)を使ってyahooやGoogleのような検索webサイト(自分のパソコン内部のファイル検索用)を構築しようと思いました。自治体・学会・企業のホームページでサイト内検索機能をよく見かけますが使用している検索エンジンはIIS+インデックスサービスかNAMAZUが多いです。どちらも費用がかからない(IISはOSに付属,NAMAZUはフリーソフト)ので普及しているようです。以前小生はPC-9801BX3+Windows95+NAMAZUの環境で動作させたことがありますので,今回はPC-9821Ra266+Windows2000+IISでトライすることにしました。
 まずインデックスサービスをインストールします。オンラインヘルプを参考にしながらカタログファイルを作ります。カタログ作成はCPUの負荷が小さい時に自動的に実行されるのでワープロなどの作業をしているとなかなかカタログができません。何もせずにしばらく放置しておくのがいいようです。「マイコンピュータ」右クリック→「管理」→「インデックスサービス」でカタログのサイズ(MB)が表示されますので進捗状況の目安としています。ある程度カタログができたら(カタログ作成途中でもよい)カタログのクエリに適当な文字を入力しテストしてみます。検索対象のファイルが表示されればインデックスサービスの動作検証はOKです。
 次にIISをインストールします。webサーバーの動作確認ためPerlもインストールしました。IIS,Perlの順にインストールです。逆ではうまくいきませんでした。Perlで作った自分のホームページの掲示板が正常に動作しました。IISの動作もOKです。
 ここまできたらいよいよ検索webサイトの構築です。OS付属の機能なので簡単にできるだろうと思ってIISやインデックスサービスのオンラインヘルプを調べましたが見つかりません。「インデックス サービスは一連のドキュメントから情報を取り出し、・・・ Webブラウザで簡単にアクセスできるようにそれらの情報を整理します。」とあるだけで具体的な内容は皆無でした。GoogleやMSNで検索してもめぼしい情報が得られません。NAMAZUの方は多くの個人ホームページで紹介されているのですがそれと対照的です。唯一の情報源はMicrosoft社のサイトからダウンロードしたIndexService.exeというファイルでした。このファイルを実行すると自己解凍しIndexService.docという2.53MB,112ページのファイルが作成されます。中身はインデックスサービス全般の詳細な解説(日本語)です。オンラインヘルプよりもこちらの方がわかりやすいです。この中に記載されているdefault.htm , sample.idq , sample.htxのサンプルコードが検索webサイト構築に必須のファイルです。
 最後にIISの設定です。「デスクトップのマイコンピュータを右クリック」→「管理」→「サービスとアプリケーション」→「インターネットインフォメーションサービス」→「規定のWebサイト」→「sample.idqを含むフォルダを右クリック」→「プロパティ」→「構成」→「追加」でアプリケーション拡張子マッピングの追加/編集ダイアログが表示されます。ここで下図のように入力しOKボタンをクリックします。この設定についてはIndexService.docにも載っていなかったので発見するまで試行錯誤の時間を費やしました。


 実際に使ってみるとYahooやGoogleと検索式が異なるのでなかなか目的の文書が見つからないことがあります。下記はそんなときの自己流対処法です。

症状原因対処
夏油温泉に関する文書を検索するため「夏油」と入力したが該当文書が無い。「夏油」は単語として認識されていない。「夏油温泉」と入力する。「"夏油温泉"」と入力する。「@contents夏油*」と入力する。
夏油温泉に関する文書を検索するため「夏油」と入力したが該当文書が多過ぎる。「夏」または「油」を含む文書が全部検出された。「"夏油"」と入力する。「夏&油」と入力する。
野球倶楽部様に送った文書を検索するため「倶楽部」と入力したが該当文書が無い。「倶楽部」は単語として認識されていない。「倶楽」と「部様」で認識。「倶楽」と入力する。「倶楽部様」と入力する。「@contents倶*」と入力する。

 インデックスサービスはワイルドカードや正規表現を使った検索ができるのでそれらを活用するのがポイントと思います。

Ra266導入記録7−2:続IIS編

2007.11.23追加
 Googleなどで検索した場合、要約文中の検索文字が太い文字で強調表示されるので効率的に検索ができるようになっています。IISでも同様な機能があれば便利ですが、ある日ネット上にその参考となるサイトを見つけました。拡張子がhtwというファイルを使用すると強調表示ができるようになります。ただしGoogleと異なる点は、

  • 検索結果として表示されたURLリストの中から強調表示したいURLを選択する必要がある。(Googleは最初から強調表示されている)


  • 検索文字列の前後の文章を表示する。文書中に検索文字列が5ヶ所あったとすると5つの文章を表示する。(Googleは3行程度の要約文の中に強調表示が1〜2個である。しかしこの表示はカスタマイズできるのかも知れない。)


  • 強調表示可能な文書はWord,Excel,Power point等のMicrosoft office製品である。一太郎、PDFは表示されない、またはエラーが発生した。
 先回と同様IISの設定です。「デスクトップのマイコンピュータを右クリック」→「管理」→「サービスとアプリケーション」→「インターネットインフォメーションサービス」→「規定のWebサイト」→「○○.htwを含むフォルダを右クリック」→「プロパティ」→「構成」→「追加」でアプリケーション拡張子マッピングの追加/編集ダイアログが表示されます。ここで下図のように入力しOKボタンをクリックします。


参考までに、小生が作成したhtm,idq,htx,htwファイル(lzh圧縮)です。
(注)Ra266は処分したため動作確認は富士通FMV6866SL6e + Windows2000professionalで行いました。

HOME | 目次 | 次へ→

inserted by FC2 system