[MUSASHI-users 448] Re: アクセスログの複数条件による集計

Back to archive index

nakahara nakap****@yahoo*****
2004年 12月 22日 (水) 02:24:12 JST


海老澤様。

中原です。

xtclassifyは決定木を生成するコマンドですので
以下の処理はxtclassifyでは無理かと思います。

ただ、MUSASHIのコマンドを組み合わせて
スクリプトとして一発で処理することは可能
だと思います。

ページビューについてもう少し詳しくお聞かせ下さい。

> ファイルは「会員ID URL 時間
> 参照元」という形にならんでいます。
> 
> 001 /a.html 2月1日 www.yahoo.co.jp
> 001 /b.html 2月1日 www.yahoo.co.jp
> 001 /a.html 2月1日 www.yahoo.co.jp
> 002 /a.html 2月1日 www.yahoo.co.jp
> 003 /a.html 2月1日 www.yahoo.co.jp

この場合のページビューとは、ID001の場合ですとURLのトータ
ルな数3になるのでしょうか、それとも顧客ごとにURLをユニ
ークした数、001の場合ですと2になるのでしょうか?

また以下のロジックの例で最終的に出てきた解は
1つのURLについての解の例だという事でよろしいですか?

確認ですが、海老澤様はすべてのURLについて、URLごとにペー
ジビューの合計数とユニークなID数を求めたいという事でよろ
しいのでしょうか?

--- Sumio Ebisawa <ebisa****@aa*****> さんからのメッ
セージ:
> 海老澤と申します。お世話になります。
> 
> 
> 現在、Webサーバのアクセスログ解析システムを構築中です
。ログ
> ファイルは「会員ID URL 時間
> 参照元」という形にならんでいます。
> 
> 001 /a.html 2月1日 www.yahoo.co.jp
> 001 /b.html 2月1日 www.yahoo.co.jp
> 001 /a.html 2月1日 www.yahoo.co.jp
> 002 /a.html 2月1日 www.yahoo.co.jp
> 003 /a.html 2月1日 www.yahoo.co.jp
> 
> 
> このデータを利用して、各URLのユニークユーザ数を数えた
いのです。
> ユニークユーザ数を出すには、URLに対して会員IDが何種類
あるかを
> 数えると出てきます。それ自体はxtaggを利用することで計
算できます。
> 問題は、会員IDがないユーザの場合です。会員IDは登録者の
み発行
> されるため、一般の人がアクセスした場合には会員IDは記録
されま
> せん。つまり
> 
> null /a.html 2月1日 www.yahoo.co.jp
> null /b.html 2月1日 www.yahoo.co.jp
> null /a.html 2月1日 www.yahoo.co.jp
> null /a.html 2月1日 www.yahoo.co.jp
> null /a.html 2月1日 www.yahoo.co.jp
> 
> というレコードが発生します。会員IDがないレコードからユ
ニークユーザ
> 数を算出するために、次のロジックを利用します。
> 
> 1 ID有りのレコードをカウントし、ページビュー数とユニ
ークユーザ数を
>   カウントする(例:ページビュー数が100/ユニークユ
ーザ数が10)
> 
> 2 ID無しのレコードをカウントし、ページビュー数だけを
カウントする
>   (例:ページビュー数が20/ユニークユーザ数は「?」
)
> 
> 3 ID有りで算出したページビュー数とユニークユーザ数の
割合を、
>   ID無しの結果に当てはめる
>   (例:100:10=20:「?」 「?」=2)
> 
> 4 ID有りの結果とID無しの推計値を足す
>   (例:ページビュー数は120、ユニークユーザ数は12)
> 
>
こんな計算がmusashiで一発でできるとうれしいのですが、xtclassify
> を利用することで実現できそうでしょうか?
> 
> 
> 
> 
> 
> 
> _______________________________________________
> MUSASHI-users mailing list
> MUSAS****@lists*****
>
http://lists.sourceforge.jp/mailman/listinfo/musashi-users




MUSASHI-users メーリングリストの案内
Back to archive index