進め方
コンテンツベース

すでにある情報ではじめられる

誤候補がないが候補が少ない
(あり:「名探偵コナン」 なし:「コナン」)

統計情報ベースも合わせて

ある程度の統計情報が必要

候補が増えるが低精度の可能性アリ
(特定の語を恣意的にたくさん検索されるとか…)