iRSSの日記

はてなダイアリーiRSSの日記の続き

Ngram+全文検索で使って、LIKE相当を高速化

全文検索なら、セナが有名ですが、LIKEの高速化を考えるとすれば、これで十分だとおもう。
UTF8もそのまま使えるのが、超便利。

# MySQL単体で動作する = 手軽、メンテが楽
# 検索結果は近似値ソートされない = LIKE検索に近い
# でも、LIKE検索に比べて数倍〓数十倍高速
# UTF8ならば、"ねっと" で検索しても "ネット" がヒットする = 文字のゆらぎ (ひらがな<>カタカナ、半角<>全角) を吸収してくれる
# INSERT/UPDATE処理が遅くなる = これらが頻繁に発生するテーブルには不向き