Namazu
2002年6月23日
対象ディレクトリを丸ごと一度に mknmz しようとしたら,
さんざん待たされたあげくに Out of memory といわれてしまった.
–checkpoint とかいうオプションも試したが無駄だった.
そこで,mknmz も月ごとのディレクトリ単位で実行することにした.
今は cron で昼休みに6月のディレクトリだけ実行してる.
現在日時から自動的に対象ディレクトリを決めて mknmz するスクリプトでも書くかな.
M$ Word, Excel, PowerPoint も検索対象に :
ActivePerl だと oleword.pl とかのフィルタが使えるんだろうか?
Cygwin では他の UNIX と同じようにツールをコンパイルして入れたら
フィルタが使えるようになった.
ただし,ファイルによって Excel のインデックスを作ってるときに
メモリを食いつぶして落ちることがあるようだ.
ファイル名がいかんのか,Excelファイル内のマクロがいかんのかは不明.
あと,xpdf は置いてあった Win 用バイナリを入れたが,日本語が読めないみたい.
検索結果 SJIS に :
日本語添付ファイル名を SJIS にしたので,
検索結果に日本語ファイル名.xls などがあると文字化けしてしまう.
.namazurc で Lang ja_JP.SJIS とフルで指定したら
検索結果全体が SJIS になってめでたしめでたし.