nakahara
nakap****@yahoo*****
2004年 12月 22日 (水) 02:24:12 JST
海老澤様。 中原です。 xtclassifyは決定木を生成するコマンドですので 以下の処理はxtclassifyでは無理かと思います。 ただ、MUSASHIのコマンドを組み合わせて スクリプトとして一発で処理することは可能 だと思います。 ページビューについてもう少し詳しくお聞かせ下さい。 > ファイルは「会員ID URL 時間 > 参照元」という形にならんでいます。 > > 001 /a.html 2月1日 www.yahoo.co.jp > 001 /b.html 2月1日 www.yahoo.co.jp > 001 /a.html 2月1日 www.yahoo.co.jp > 002 /a.html 2月1日 www.yahoo.co.jp > 003 /a.html 2月1日 www.yahoo.co.jp この場合のページビューとは、ID001の場合ですとURLのトータ ルな数3になるのでしょうか、それとも顧客ごとにURLをユニ ークした数、001の場合ですと2になるのでしょうか? また以下のロジックの例で最終的に出てきた解は 1つのURLについての解の例だという事でよろしいですか? 確認ですが、海老澤様はすべてのURLについて、URLごとにペー ジビューの合計数とユニークなID数を求めたいという事でよろ しいのでしょうか? --- Sumio Ebisawa <ebisa****@aa*****> さんからのメッ セージ: > 海老澤と申します。お世話になります。 > > > 現在、Webサーバのアクセスログ解析システムを構築中です 。ログ > ファイルは「会員ID URL 時間 > 参照元」という形にならんでいます。 > > 001 /a.html 2月1日 www.yahoo.co.jp > 001 /b.html 2月1日 www.yahoo.co.jp > 001 /a.html 2月1日 www.yahoo.co.jp > 002 /a.html 2月1日 www.yahoo.co.jp > 003 /a.html 2月1日 www.yahoo.co.jp > > > このデータを利用して、各URLのユニークユーザ数を数えた いのです。 > ユニークユーザ数を出すには、URLに対して会員IDが何種類 あるかを > 数えると出てきます。それ自体はxtaggを利用することで計 算できます。 > 問題は、会員IDがないユーザの場合です。会員IDは登録者の み発行 > されるため、一般の人がアクセスした場合には会員IDは記録 されま > せん。つまり > > null /a.html 2月1日 www.yahoo.co.jp > null /b.html 2月1日 www.yahoo.co.jp > null /a.html 2月1日 www.yahoo.co.jp > null /a.html 2月1日 www.yahoo.co.jp > null /a.html 2月1日 www.yahoo.co.jp > > というレコードが発生します。会員IDがないレコードからユ ニークユーザ > 数を算出するために、次のロジックを利用します。 > > 1 ID有りのレコードをカウントし、ページビュー数とユニ ークユーザ数を > カウントする(例:ページビュー数が100/ユニークユ ーザ数が10) > > 2 ID無しのレコードをカウントし、ページビュー数だけを カウントする > (例:ページビュー数が20/ユニークユーザ数は「?」 ) > > 3 ID有りで算出したページビュー数とユニークユーザ数の 割合を、 > ID無しの結果に当てはめる > (例:100:10=20:「?」 「?」=2) > > 4 ID有りの結果とID無しの推計値を足す > (例:ページビュー数は120、ユニークユーザ数は12) > > こんな計算がmusashiで一発でできるとうれしいのですが、xtclassify > を利用することで実現できそうでしょうか? > > > > > > > _______________________________________________ > MUSASHI-users mailing list > MUSAS****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/musashi-users