How Google autocomplete predictions are generatedに概要的な話が書いてあったので、その概要をまとめると
- 検索している言語や場所によって内容を変える
- 文書になっているような長いクエリーは一部だけから生成する
- 最近の話題などのフレッシュネスが考慮する
- クエリーのトピックを考慮する(旅行といっても場所によって目的とか異なるとか)
- 不適切なワードは自動でチェックする
- 人名の誹謗中傷を防ぐ
という感じだろうか。
Fessでも対応できている部分もあれば、不適切ワードの自動除外とか、対応できていない部分もあるなと…。Fessだと、ワードを並べただけのような複数語のサジェストワード生成などの対応を考慮したりしているのだけど、その辺がどうしているのかとかは書いていなかったので、どうしているのかなと気になったままである…。