横浜FCと横浜FCと横浜FCとあと横浜FCなんかに関して書いたり書かなかったりします。ほかの事を書くこともあります。
by naminos
S M T W T F S
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
(いんちきやろう、このコラムをコピーしてみろよ)。
Yahoo!ニュース - japan.internet.com - Googlewashing から逃れるには

コピーなど指先ひとつで出来るのですよ。

Googlewashing から逃れるには

Web に掲載した記事が誰かにコピーされ、あたかもその盗作者が書いたかのように掲載されたら、かなり気分が悪い。まして、同じ語句を使って検索エンジンで検索すると、その盗作者の Web ページのほうが自分のページより上位にランキングいるとしたら、まったくひどい話だ。

先週 書いたように、盗作者のページがオリジナルページより上位に来る問題は、「Googlewashing」と呼ばれている。この問題は、友人が無邪気に記事を抜粋し、合法的にオリジナルページにソースとしてリンクさせたとしても、特定の用語で検索すると、オリジナルの Web ページが Google のトップ10のリスティングから外れてしまう、といったことが起きるほどひどいものだ。

今回は、どうやったら他人に文書をコピーされずにすむのか、また、自分の記事が他のページで合法的に引用された場合、検索エンジンのランキングで不利な結果を招かないようにする方法を解説する。

トラックバックは危険

無意識に、他社のサイトを自分のサイトより上位にランキングさせてしまう会社が多い。

SEO の専門家は、コンテンツを盗み、盗作したページに人為的に Google の最高評価である Page Rank 10 を与える方法を見つけた、と先週報告した。このごまかしの対応策については、次回のコラムで説明しようと思う。

今回は、いんちきをしないで、通常の検索エンジンの評価に基づいたランキングのみ扱うことにする。

以下に、サイトが被害をこうむる可能性のある状況を、大まかにまとめた。

記事または Blog の公開。

トラフィックを伸ばそうと、新鮮でおもしろいコンテンツの作成に膨大な時間と金を投資しているかもしれない。残念ながら、ほとんどすべての Web ページは、倫理的に劣った人物が簡単にコピーし、自分のオリジナルのように掲載できる。 RSS で配信されているコンテンツの場合、その作業の過程を簡単に自動化できる。

オリジナル記事に対するコメントを掲載。

あからさまな盗作と違い、他のサイトがオリジナル記事の1、2段落を引用し、コメントを載せることは、非常によくあることである。これは、ほとんどの国の著作権法で「公正使用」とみなされている。コメンターがオリジナルの記事にリンクさせれば、まったく問題ない。

オリジナルページにコメンターへのリンクを貼る、つまり「トラックバック」する。

一部の Web サイトでは、他のサイトに引用され、コメントが載せられた場合、そのコメントの一部を自動的にオリジナルページに載せるようにプログラムされたものがある。このような相互参照を「トラックバック」と呼び、普通コメンターのサイトへのリンクも貼られる。残念ながら、自分の記事を引用した他のサイトにリンクさせると、検索エンジンのランキングの評価で、そのサイトにボーナスポイントを与え、オリジナル記事より上位に押し上げる可能性がある。

トラックバックは礼儀にかなっている。しかし、自分が書いた特定のトピックが検索されたとき、コメンターのサイトをオリジナルのサイトより上位にランキングさせる手助けは、する必要はない。

「Follow」すべきか、あるいは「Nofollow」すべきか、それが問題

あるインタビューで、MSN Search の関連性データアナリスト Andy Edmonds 氏は、トラックバックやその他コメント関連のリンクを使っている企業に、 nofollow と呼ばれる特性を使うよう提案した。

この技を使うには、自分のコンテンツに対してコメントを掲載したサイトにリンクさせるとき、 rel="nofollow" 属性を追加する。たいていの検索エンジンは、このようなリンクがサイトの「未承認」のものだ、と判断する。従って、リンクさせてもそのページの重要度を高めることはない。 Google、Yahoo、MSN Search とその他のインデックスは、2005年1月より nofollow 属性を承認するようになった。

サイトのコメント箇所にあるすべてのリンクに nofollow を追加するのは、実に簡単になり、コードを手入力する必要もない。コメントに自動的にこの属性を追加(または削除)する方法が、 MovableType 、 Blogger 、 WordPress など主要 blog ツールにたいてい付いている。

自分のサイトのトラックバック(そして自分のコメント箇所)にこの特性を使うことは、論理的な拡張である。確かに、 IOError などのサイトで言われるように、nofollow を使うことに心から反対する意見もある。この属性への強い批判は、 コメントスパム 対策として開発された nofollow が、この問題を解決できずにいるということに対するものだ。

しかし nofollow は、そのサイトが発信源ではないコンテンツを、検索エンジンが見極めるのに役立つ方法だと思う。またこの特性は、そうしたいなら少し手順を追加して、個々のリンクに対し、有効か無効かを選択することができる。

meta タグは好きではないので使ったことがない

理想的には、検索エンジンは自動的に、新しく投稿された記事を「オリジナル記事」として認識する。そして、参照しただけの Web ページよりオリジナル記事が上位にランキングされるはず。

MSN の Edmonds 氏は、特定のコンテンツを最初に掲載したページを、検索エンジンが見極めるのに役立つ方法を提案している。これは、記事が発行された日付を含む meta タグを使う方法。互いを参照するリンクを含む複数の Web では、検索エンジンはもっとも日付が早いページを「オリジナルコンテンツ」とみなすはず。従って、続きのページにもマッチする用語で検索すると、そのページが上位にランキングされるはずだ。

この種のタグを広めようと、meta date の標準化を提案するグループ Dublin Core が、 Date要素 を発表している。残念なことに SearchEngineWatch によると、大部分の検索エンジンが認識している meta タグはごくわずかで、 date はその中に入っていない。

現在 date meta タグはあまり広く対応できていないが、今後も検索エンジンが認識しないという意味ではないので、それを使っても問題はない。「社会全体の慣習にすれば、この問題の解決の手助けになるだろう」と、 Edmonds 氏は言う。

コンテンツの完全盗作を阻止

おそらく一番問題なのは、作品を合法的に引用したページがオリジナルページより上位に表示されることではなく、記事を一語一語コピーし、自分の作品として掲載している不誠実な人だ。近頃は、この不正行為の主要な動機になるものがある。 Google や他のサービスが配信するテキスト広告は、クリックごとに Web サイトに料金を支払うシステムなので、ただ訪問者が広告リンクをクリックすれば儲けものと、どんな記事でも見つけたものすべてを使って、できるだけ多くのページを作ろうとする人がたくさんいる。

明らかにコピーしているサイトを見つける方法のひとつに、Copyscape の Copysentry などのサービスに加入する方法がある。これは、月々9.95ドルから19.95ドル(小規模で手動での検索の場合無料)で、10ないし20ページ、どちらか自分で選択したページ数マッチする文を含む Web ページがあるかどうか、毎週または毎日報告するサービス。さらに月々0.25ドルから1.00ドルの料金で、ページ数を追加できる。

(中略)

結論

未承認のコピーサイトの問題は、完全になくなることはないが、少なくとも悪質な犯人を捕まえることで、少しずつでも満足感を多少味わうことができるはずだ。記事全文を無許可でコピーなんて、ずうずうしいにもほどがある。(いんちきやろう、このコラムをコピーしてみろよ)。


所詮ネットの文章など書き捨て。やっぱ本じゃなきゃダメよね。
[PR]
by naminos | 2005-11-25 22:53 | 人間観察
<< 年末PSP 20Q >>