Google のキャッシュ機能についての問題点 †
Google には Google がクロールした page をキャッシュした結果を公開する機能があります。この機能により、例えば相手側のサイトが落ちていたり、データ転送が遅かったとしてもキャッシュ機能により素早く情報を引き出すことが出来ます。
現在では Google 以外にも MSN や Yahoo! 等の検索エンジンでキャッシュ機能が実装されています。
この機能は便利なのですが、それ以上に多くの問題点が指摘されています。
- 不用意に公開してしまった情報がキャッシュ機能により閲覧出来てしまう
大元のサイトから意図していない page を削除したとしても、キャッシュとしてしばらく(6-8週間位?)は残っています。サイトから削除しただけでは対策にならなくなっています。また、サイトから削除したとしても page によってはかなり長い期間、キャッシュが保持されることがあるようです。1年前に引越しして削除した page のキャッシュが未だに存在します。
Google にはキャッシュを削除するための手順が公開されています。これを利用すれば若干状況が良くなるかもしれません。
- フィルタリングした情報がキャッシュ機能により閲覧出来てしまう
会社のネットワーク管理者や親御さんが有害なサイトとしてフィルタリングを行った page でもキャッシュ機能を利用することで閲覧できてしまうことが問題になっています。特に Google のイメージ検索では、教育的に不適切な画像も閲覧できてしまうことが問題になっています。最近ではキャッシュ機能自体を有害とし、フィルタリングすることが多くなっているようです。
残念なことですが悪意のある情報や危険性のある情報をフィルタリングして公然と垂れ流す雑誌等を見ると今の時代、仕方の無いことかもしれませんね。
- キャッシュ機能は著作権侵害?
キャッシュ機能は、私的利用を超えた複製にあたり著作権を侵害している可能性があることが問題になっています。Google のイメージ検索でもサブネイル表示が問題になっています。ネットの利便性とフェアユースのバランスだと思うのですが、色々難しい問題だとは思います。
- Google Hacking
Google Hacking は、ネットに公開した覚えの無い情報を取得する手法のことを指します。Google のキャッシュ機能も Google Hacking には欠かせない機能となっており問題視されています。
上記の問題点の多くは、ネットに情報を公開する側の検索エンジンへの認識不足が招いた「事故」ではないでしょうか。ネットの利便性を享受しつつ上記の問題点に対応するには、情報を公開する側が問題点を正しく理解し、覚悟した上でネットに公開する必要があるのではないでしょうか。
SNS も一つの解かもしれません。この場合、他人の公開情報を自分のローカルやローカルなネット環境でのみ活用することになるので、ネットの相互作用には寄与することは出来ないかもしれません。相互作用の輪から外れることでネットがやせ細る可能性も否定できなくなる時代が来るのかもしれません。
「名無しさん」も一つの解ではあると思うのですが、「名無しさん」であることが故に、公開した情報の責任から逃れられるという認識だと、いつかその自由は奪われてしまう気がしてなりません。「自浄機能が働かないと、どんどん自由が奪われる」と言った所かな。「名無しさん」が故に著作権者が誰か判断できず、公の場で利用しにくいという別の側面も最近顕著になってきているように感じます。
話が逸れましたね。
関連情報 †
- Google のインデックスからコンテンツを削除するには (Google)
キャッシュされた page を消す方法について記載があります。また META タグに「<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">」と記載することでキャッシュ機能だけを無効にすることも可能です。
キャッシュ機能の無効化は、サイト管理者からしてみると魅力的なのですがサイト利用者からしてみるとキャッシュ機能が利用できなくなるので不満に感じることが多いでしょうね。
News †
- Googleのキャッシュに約90万人分の住民登録番号 - 韓国 (MYCOMジャーナル, 06.08.01)
- キャッシュは著作権侵害にあたらず--グーグルが裁判で勝訴 (CNET Japan, 06.03.17)
[WSJ] 「Googleキャッシュは著作権侵害ではない」と米裁判所 (ITmedia)
- グーグルの画像検索に差し止め命令--米グラビアサイトの訴えが認められる (CNET Japan, 06.02.22)
アダルト企業、対Google著作権侵害訴訟で白星 (ITmedia)
米国の裁判で Google のイメージ検索が著作権侵害として認められたとのこと。認められた原因として「Googleが著作権侵害にあたる画像を掲載したこれらの写真サイトにAdSense広告を提供し、売上を得ている点」と「Googleが携帯電話用にも画像検索機能を提供している点」を挙げている。
前者は、それが著作権侵害しているイメージかどうか判断できないだろうから、見つけ次第 AdSense 狩りしか対策は無さそう。
後者は、Google Mobileの画像検索オプションと訴えた側の Perfect 10 の有償コンテンツサービスと差が無いことにより営業妨害(?)として認められたらしい。
- ウェブページのキャッシュで著作権違反?--カナダで法案審議へ (CNET Japan, 05.07.20)
検索エンジンのキャッシュの扱いについても論議が出てきそう。
- 【レポート】DefCon 11レポート - ハッキングツールとしても通用するGoogleの検索力 (MYCOM PC WEB, 03.08.07)
Google に cache された情報よりパスワード等を引き出せる危険性について記載があります。
- Googleキャッシュで鳥取県個人情報流出の2次被害 (Slashdot.jp, 03.08.11)
ネット上に情報を公開する時には常に緊張を持つ必要がある意味でよい教育材料になっていると思うのですが。
- Googleキャッシュを利用するクラッカーたち (ITmedia, 03.08.01)
- Googleに新たな懸念――キャッシュ機能はWeb出版の敵? (from archive.org, 03.07.11)
何気に Google cache 以外にも search engine 全体に対しても問題定義しているように見える。「Googleは巡回したWebサイトをすべて、許可も求めずにコピーしている。厳密に考えれば、これは著作権侵害だ」という意見は如何なものかと思う。「許可を求める」ことの難しさは既にオープンソースソフトウェアで立証済みだ。情報を共有する術を「今までの方法とは別」に考え出すことが出来ないのであれば、page に password でも設けて孤独に公開することをお勧めしたい。
- 検索エンジンは個人情報保護法の規制対象外 (Slashdot.jp, 03.04.18)
Google cache についても話題に挙がっていました。
- GoogleがDMCA的削除要求を公開 (Slashdot.jp, 02.04.14)
DMCA に則って Google cache を削除しようとした E-Mail を Google が公開しているらしい。まぁ黙って削除されるよりかはナンボかマシとは思うのだが、公開するのなら全て公開して欲しいよな。自分の都合だけで公開するのであれば、そりゃ私刑だろう。
- 検索エンジンのキャッシュは著作権侵害か? (Slashdot.jp, 02.03.18)
特に Google に限ったことではないのですが「検索エンジンのキャッシュ機能は著作権を侵害しているのではないか」という議論。こんなこと、数年前だったら問題にならなかったと思う。使用者がネットの特質を理解して「自己責任」で情報を公開しなければならないのだから。
ヲタからネットワークを強奪し、自分の住みやすいように勝手に解釈するのは、、、いかがなものであろうか?
- Googleキャッシュとウェブフィルタ (Slashdot.jp, 01.12.12)
これじゃ Google が可哀相。ガキに Network は不要。
- 『グーグル』のキャッシュでサイトを復元 (Wired News, 01.01.15)
Google ネタ。Google はキャッシュのために4〜5テラバイトのディスクを使用しているらしい。ページだと13億アーカイブ。すげえや。