パスワードを忘れた? アカウント作成
13902961 story
Google

10年前のサイトはGoogle検索に表示されない? 14

ストーリー by hylom
単に更新日時の重みを大きくしているだけでは 部門より
あるAnonymous Coward曰く、

Lifehackerが、「10年前のサイトはGoogle検索に表示されない」という話を取り上げている。

ただ、元ネタとなっている記事を執筆したTim Bray氏の場合、ブログ記事がバズってから検索に出てくるようになったそうなので、単純にインデックスを削除しているわけではないらしい。

ところでDuckDuckGoの設立は2008年だが、2006年のインデックスはどこから出てきたのだろうか。Bingの開始は2009年だが、前身のWindows Liveサーチまで含めれば2006年のインデックスを持っていることにいちおうの説明はつく。さらに前身のMSNサーチは1998年までさかのぼるが、MSが独自エンジンを始めたのは2004年からなので、それ以前のインデックスを持っているかは疑わしい。

リンク先で紹介されている他の代替サービスは本当に10年前から存在するのだろうか(そもそも日本語圏ではほとんど役に立たないが)。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2019年05月07日 15時16分 (#3610517)

    新しく更新されたニュースやブログのページが使用上、上位表示されて、それに埋もれているだけで実際には表示されている。

    • by Anonymous Coward

      バズ狙いのでっち上げ記事だ

    • 新しく更新された情報を重視しているせいで、オリジナルの価値のある情報は圏外に埋もれてしまっていて、
      その圏外の情報をまとめただけ(よく分かっていない人がまとめているので、そのまとめる過程で間違いを多く含んで劣化している)のゴミみたいなアフィサイトが上位に表示されてしまっている。

      芸能関係だけならともかく、プログラミングやインフラ関係の技術サイトでもその現象が起きている。

      でも新しい情報の方が価値があるのでは? と思うかもしれないけど、そのアフィサイトはネット検索ででた情報をまとめているだけなので、
      今では通用しないような古い作法も紛れ込んでいて有害極まりなかったりする。

      AIがどうのこうのと言ってる癖にGoogleのアルゴリズムは学術的な目的で考えるとどんどん退化しているように思える。
      尤も、アフィサイトには Google アドセンスが貼られていることが多いので、広告無しのオリジナルサイトやら公式リファレンスよりアフィサイトに誘導した方がGoogleは儲かるんだろうけど。

      • by Anonymous Coward

        Googleアドセンスが貼られているページは検索スコアが高くなる、とかないだろうか?

        • by Anonymous Coward

          直接アドセンスが貼られてるサイトを上位、みたいなばれそうなことはやってないだろうが、
          統計的にアドセンスが貼られてることが多いタイプのサイトが上位になるように
          ページランクを調整するみたいなことをやっててもおかしくない

          • by Anonymous Coward

            アドセンスを貼っているようなサイトはそうでないサイトに比べてSEOを意識しているだろうから、Googleに操作意図がなくてもページランクが高くなるのはある意味当然の帰着と言える。

      • by Anonymous Coward

        なんだかんだで共通した特徴があるのでそれを基にランク下げてほしい所ですねえ
        ブログ風だけどコメント投稿できないとかAuthor=サイト名とか
        商品レビューとかまとめの癖にアフィはあってもメーカへのリンク無いとか...

        • by Anonymous Coward

          Googleには正確な情報を提供する動機がないからな
          同じ記事を消して貼り直すだけの迷惑サイトもGoogleから見ればアフィがクリックされる良いサイト
          時々ガス抜きポーズで消して見せたりするが本音では良いサイトの順位をわざわざ下げる理由がない

          • by Anonymous Coward

            その通りだけど、ここまで大きくなったらGoogleが何しようとも世間は従わざるをえないわけで、正義を執行する欲に駆られたりはしないものかと。
            暴走したらヤバいけどね。

    • by Anonymous Coward

      www.google.com/search?q="職場にグリコのがあります"
      www.google.com/search?q="郵貯チェックカードユーザですが"
      www.google.com/search?q="朝から何してらしたんでしょうか"

      うん、2004年5月7日はクリア。

      • 昔作ったページ [doga.jp](1999年公開、静的htmlなので今アクセスしてもLast-Modifiedは1999年6月23日)が、
        それなりなキーワードでググった [google.com]らちゃんと一覧に出てきました。
        ニコニコ大百科・ピクシブには負けたけど、Wikipediaよりは上。

        #若気の至りだけど、いいやもうIDで。

        • あー、なんか荒らしってモデられてる。説明不足だったか。最終更新が1999年のページもちゃんとグーグルにインデックスされてるよ、って報告だったんですけどね。

          で、ついでにもうちょっと調べたら、最終更新が1997年のページもちゃんとインデックスされてました。
          ただし、1999年のページはGoogleにキャッシュされてる(検索結果一覧のURL欄の▼クリックで、「キャッシュ」がありました)けど、1997年のページはキャッシュされてませんでした。なんか扱いが違う…

          親コメント
  • by Anonymous Coward on 2019年05月07日 20時46分 (#3610680)

    > 設立は2008年だが、2006年のインデックスはどこから出てきたのだろうか

    スタティックなページだとしたら作成年月日が取れるから2008年からインデックス作り始めても
    2006年のページは集められるでしょ。
    XXXX年のインデックスと言ったって、その意味はXXXX年”に取得した”インデックスではなくて、
    XXXX年”に作られたページの”インデックスなんだから。

    • by Anonymous Coward

      > XXXX年のインデックスと言ったって、その意味はXXXX年”に取得した”インデックスではなくて、
      > XXXX年”に作られたページの”インデックスなんだから。

      それだと「2006年のインデックス」には2005年以前に作られたページが含まれないことになるから「XXXX年に取得したインデックス」のほうが合ってると思う。

typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...