[Tep-j-general] Re: Yahoo 検索について (ページのインデックス化)

Back to archive index

hamada bungu****@leo*****
2004年 7月 13日 (火) 10:58:26 JST


こんにちわ。

On Tue, 13 Jul 2004 09:13:38 +0900
TAMURA Toshihiko <tamur****@bitsc*****> wrote:

> もしよろしければ、この問題に関心のあるみなさんに
> 上のような情報を出してもらえれば、YSTのインデックス化の
> 傾向をつかむ参考になるのではないかと思います。

ということで、恥ずかしながら当方も末席を汚させて頂きます(~_~;)

●サイトの概要
商品点数          : 1500弱
カテゴリー階層    : 2〜6階層(商品分野により異なる)

商品一覧ページ    : あり

 mklist		トップ → 商品リスト → 商品詳細
 mklist2	トップ→メーカー一覧→メーカー毎商品→商品詳細

  o カテゴリー階層:
		mklist :1階層 (トップから商品詳細まで2回リンク)
		mklist2:2階層 (トップから商品詳細まで3回リンク)

  o リストページ中の商品数: 平均50 (←mklist2によるもの)

「商品一覧ページ」はmklist/mklist2を使用して静的に生成したHTMLファイル。
cronで日に3度作り直している。

・mklist→全商品一覧。埋め込みリンク数約4,000
・mklist2→メーカー毎商品一覧&全メーカー一覧

その他AllProductsも併設。

サーチエンジン対策のURLを使用: true
Spiderkiller                 : true
(が、昨日入れたばかりなので未だ結果には関係ないと思われる:^^;)

●インデックス化されているページ数
  Google   : 4200ページ
  YST Japan:  400ページ (商品詳細のインデックス化は約15%)

ざっとこんな感じでしょうか?

商品数に比してGoogleのインデックスが多いのは、

・各段階の商品一覧がインデックスされている
・AllProductsとmklistを併用している

等の理由が大きいようです。

たとえば同一の商品名が

/catalog/default.php/cPath/23_166_123

というカテゴリ商品一覧に加え

/catalog/list/list00047.html
/catalog/list.html
/catalog/all_products.php

という各レベル商品一覧や

/catalog/product_info.php/products_id/288
(↑旧mklist/AllProductsによるリンク)

/catalog/product_info.php/cPath/23_166_123/products_id/288
(↑mklist/mklist2によるリンク)

/catalog/product_info.php/manufacturers_id/47/products_id/288
(↑メーカーからリンクを辿った場合)

として別々にインデックスされている→このような例がかなり沢山ありまして、
「全商品よりもインデックス数のほうが多い」という奇妙な状況に。

(まぁGoogleは同一サイトの検索結果をまとめちゃうんで、沢山インデックスさ
れててもあまり大したメリットはない)

ちなみにYSTでは殆どダブリがありません。「絶対数が少ないので確率論的にダ
ブりにくい」とも言えますが。

また、YSTにインデックスされている中に商品詳細ページ(product_info.php)の
インデックスはあまり多くなく、カテゴリの一覧ページ(default.php/cPath)が
目立つような気がします。

これは、もしかすると「YSTのSERPsにはリンク集が一杯出てくる」ことと何か関
連があるのかもしれません。(=YSTはリンクが一杯書いてあるページが好き?!
仮説)

> また、ご意見や新しい情報があれば教えてください。

当方が結構気にしているものに「トップページの更新頻度」があります。

osCがトップな場合はあんまり関係ないのかもしれませんが、当方はそれより上
位にコンテンツを置いてますので、そちらのほうの更新頻度によってフレッシュ
クロールを呼び込める可能性が増しそうかな〜、とか。

まぁ、実際にはSSIで日付を表示し、(s)HTMLファイルのパーミッションを755に
しとけばいいだけらしいんですけど(^_^;)

PHPで動作するosC自体は「If-Modified-Since」に対して常に「200 OK」を返す
みたい→Last-Modifiedを返さないのが(「未対応」と判定されそうで)ちょっ
と気になりますけど、基本的には大丈夫かな?と。

http://de3.php.net/manual/ja/function.header.php

とか見ると

header( "Last-Modified: " . 適当な時間);

とか書いとけばLast-Modifiedを返せなくもないみたい→「常に30分前に更新さ
れた事にする」とか出来なくもないみたいなんですが。

常に先頭で呼ばれるapplication_top.phpに書いとけばいいのかなぁ??
(実際にやる気はあまりないのでかなりいい加減:^^;)

はまだ






Tep-j-general メーリングリストの案内
Back to archive index