Fessでは、クロール対象のファイルパスをCSVファイルに記載して、そのファイルパス群をクロールすることができます。 CSVファイルリストを利用するクロールは第19回で紹介しています。
ファイルリストを利用したクロールでは、SMB認証が適用されたファイルサーバを利用することも多いので、今回はクロール対象のファイルサーバにアクセスする際に認証が必要な場合の設定について説明します。
CSVファイルの作成
まずはクロールするファイルのパスを記述するCSVファイルを作成します。 CSVファイルのフォーマットは第19回の「CsvListDataStore」を参照してください。
今回は、クロール対象のファイルを\\localhost\public
フォルダ内に配置しているものとして、CSVファイルを以下のように作成します。
modify,smb://localhost/public/msoffice/test.doc
modify,smb://localhost/public/msoffice/test.xlsx
modify,smb://localhost/public/msoffice/test.xls
modify,smb://localhost/public/msoffice/test.pptx
modify,smb://localhost/public/msoffice/test.ppt
modify,smb://localhost/public/msoffice/test.docx
modify,smb://localhost/public/pdf/test.pdf
CSVファイルを保存する場所とファイル名は任意です。今回はこのCSVファイルが置いてある場所をクロール設定で指定します。
プラグインのインストール
ここからはFessの管理画面での操作になります。 今回使用するFessのバージョンは14.4.0です。
クロール設定の前に、クロール時に使用するプラグインをインストールします。 以前のFessのバージョンでは、fess-ds-csvプラグインはバンドルされていたので、このプラグインのインストール手順は不要です。
Fessの管理画面にログインして「システム」>「プラグイン」>「インストール」をクリックします。 「リモートタブ」で「fess-ds-csv-14.4.0」を選択して、「インストール」をクリックするとプラグインがインストールされます。
インストール後、プラグイン一覧画面を表示して、fess-ds-csvが登録されていることを確認してください。