2004年06月12日(Sat) いつのまにか日が変わっていた。帰ろう。 [長年日記]
● [tDiary] リンク元強化プラグインはあまり速くならなかった
あおきさんにヒントをいただいて、リンク元強化プラグインの強化をはじめたわけですが。下記、この日誌に6月10日ごろまでにいただいたリファラ22192個(うち検索エンジン以外が969個)についてCerelon 300MHz、ruby 1.9.0 (2004-05-21) [i686-linux]、Nora、uconvなしで処理をさせた結果です。
改造前 | \Aと[^./]を使用 | さらにcomapny_nameを使わず総当たり | |
---|---|---|---|
実時間 | 1分20秒 | 1分20秒 | 1分50秒 |
ユーザー時間 | 1分19秒 | 1分19秒 | 1分50秒 |
システム時間 | 0.19秒 | 0.17秒 | 0.26秒 |
というわけで有意な差がない。
後から気づいたのですが、disp_referrer.rbのparse_as_search()は、まずホスト名で適当に検索エンジンのアタリを付けておいてから(DispRef2String::company_name)、その検索エンジンについての正規表現を順に適用していくのです。つまり、既に、正規表現のマッチ作業の回数は最小限に抑えられている。
なので、残念ながらあおきさんの書かれたような効果は得られなかっったのです。
とにかく、正規表現のマッチ範囲は必要十分なのが一番なので、青木さんのヒントの通り、よりマッチ範囲を狭めたものをcommitしました。
(追記)検索エンジンのアタリを付けないでおくと、上の表のもう少し遅くなりました。ここで改良前の正規表現を使ってるとさらに遅くなるんだろうけど。
● コナは雨だった
観光客の人がずぶ濡れに。ご愁傷さまです。
僕はというと、ウォルマートの場所は思い出せないし(結局サブウェイのお兄ちゃんに教えてもらった)、目当ての品物は売り切れてるし、散々なドライブではあったのだけれど。まあ、久しぶりに夕陽を眺めたのでヨシとしよう。
あ、もしかして総当たり=~の方が速いか?
最近のツッコまれどころ