検索式の指定方法
- ■単一単語検索
- 調べたい単語を一つ指定するだけのもっとも基本的な検索手法です。
(例) 映画
- ■AND検索
- ある単語とある単語の両方を含む文書を検索します。検索結果を絞り込むのに有効です。3つ以上の単語を指定することも可能です。単語と単語の間に and を挿みます。
(例) 映画 and アクション
and は省略できます。単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します。
(例) 映画 アクション
- ■OR検索
- ある単語とある単語のどちらかを含む文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に or を挿みます。
(例) 映画 or DVD
- ■NOT検索
- ある単語を含み、ある単語を含まない文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に
not を挿みます。
(例) 映画 not バイオレンス
意味 : "映画"は含むが"バイオレンス"は含まない文書を検索する。
- ■グループ化
- AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両隣には空白を入れる必要があります。
(例) (映画 or DVD ) and アクション not バイオレンス
意味 : "映画"または"DVD"は含んで、かつ"アクション"を含み、しかし"バイオレンス"は含まない文書を検索する。
- ■部分一致検索
- 部分一致検索には前方一致、中間一致、後方一致の 3種類があります。部分一致させたい所に
* をつけます。
- 前方一致検索
映画* ... 映画館、映画情報などの単語が該当します。
- 中間一致検索
*映画* ... 最新映画情報などが該当します。また、東映画像などにも該当します。
- 後方一致検索
*映画 ... 日本映画、最新映画などが該当します。
- ■正規表現検索
- 検索するキーワードを正規表現で指定します。正規表現は /.../ のようにスラッシュ記号で囲みます。正規表現のエンジンにはRubyのコードを利用しています。正規表現の書式はPerlとほぼ同じです。
(例) /[フランス|アメリカ]映画/ ... "フランス映画"または"アメリカ映画"が該当します。
特記事項
- いずれの検索方法でもアルファベットの大文字・小文字の区別はしません。
- 日本語の複合語は形態素単位に分割し、それらを フレイズ検索します。分割は不適切に行なわれることがあります。
- JIS X 0208 (いわゆる全角文字) の英数字と記号の一部 (ASCIIと重複しているもの)
は ASCII (いわゆる半角文字) として処理されます。
- 記号を含む語の検索ができます。例: TCP/IP。ただし、記号の処理は完全ではないので
TCP and IP のように分割してAND検索をかけた方が取りこぼしがありません (その代わり余計なファイルまでヒットしてしまう可能性があります)。
- 中間一致・後方一致、正規表現、フィールド指定の検索には少し時間がかかります。
- and, or, not を単語として検索したいときはそれぞれ、 "..." と2重引用符で、あるいは
{...} と中括弧で囲みます。