アフィリエイト初心者が大金を稼ぐブログ

ブラック企業を退職した管理人がアフィリエイトで四苦八苦している様子を公開します

*

スパムサイトからブログ記事を無断でコピーされた

   

b4fe9306bdd87c33f3290e43369d2f18_s

不自然な被リンクを発見

ある日、毎日の日課になっているGoogle Search Console(旧ウェブマスターツール)の確認をしていたところ、私が所有しているアダルトサイトに対して、大量の被リンクがついていることが判明しました。

以下は、Google Search Consoleの「サイトへのリンク」というページです。

不自然なサイトへのリンク

「サイトへのリンク」では、自分が管理しているサイトに対してリンクを張っているドメインやページを知ることができます。上記のキャプチャを見る限り、複数のドメインから合計で約600本近い被リンクが張られていることになります。

通常であれば、被リンクを獲得することはSEO上メリットが大きいため、喜ぶべきところですが、あまりに突然でしかも数が多すぎるために違和感を感じました。そこで、リンクを張っているページにアクセスしてみると、案の定、私のサイトを無断転載したスパムサイトだったのです。

スパムサイトの実態

そのスパムサイトが、どのようなサイト構造であったのか簡単に説明します。

スパムサイト構成

まず、私のサイトにある記事のタイトルをそのまま掲載し、さらに記事のテキスト部分をそのまま掲載しています。そして、引用元として私のサイトへのリンクが張ってありました。また、私が管理しているサイトの記事にある画像を全て取得し、画像についても掲載しています。このような記事が一つのドメインに数千ページ存在しており、おそらくツールを使って自動生成したアフィリエイトサイトだと思います。

しかも厄介なことに、無断転載された画像の一つ一つをクリックすると、それぞれ異なるURLのページが表示され、そこにも上記の構成と同じ無断転載のページが表示されます。つまり、1つの記事がパクられるだけで、一気に無断転載のページが画像の数だけ10個とか20個も生成されてしまうのです。

サイトへのリンクで大量の被リンクが表示されていた理由は、このようなドメインが多数存在し、そこから大量の被リンクが張られていたからでした。

記事の引用と著作権侵害

著作権法の三十二条では「公表された著作物は、引用して利用することができる」と明記されており、一般に公開されている記事を引用することは法的に認められている権利です。それも、権利者に無許可で引用できる点がポイントです。引用が全くできなければ、憲法で保障されている言論の自由に支障が出てしまうからですね。

しかし、何でもかんでも引用できてしまうと、今度は著作権者が困ってしまいます。そこで、引用が認められるためには幾つか要件が存在し、それら全てに該当しない場合は引用できないというのが通説になっています。

その要件の中から、特に重要だと思う点について抜粋します。

・「出所の明示」があること
・引用を行う「必然性」があること
・引用部分とそれ以外の部分の「主従関係」が明確であること

これらの要件に対して、今回の事例を考えていきます。まず一つ目の「出所の明示」に関しては問題なさそうです。引用元として、私のサイトのURLがきちんと記載されていました。次に、引用を行う必然性ですが、これは満たさないでしょう。そもそも、記事の全てが「引用」で構成されている以上、必然性があるはずがありません。また、引用が許可されるのは、引用を行う部分が少ないケースに限定されます。引用部分が1000文字で、それ以外のオリジナルの文章が100文字という感じでは、主従関係が逆転しているため、引用は認められないのです。今回の件では、引用以外の文章が全く存在しないのですから論外です。

以上より、今回のケースに関しては引用が認められず、著作権侵害であると言えそうです。

スパムサイトを放置すると害はあるのか

それでは、このようなスパムサイトが放置されていると、私のサイトに悪影響はあるのでしょうか?特に悪影響がないのであれば、たとえ著作権侵害があったとしても、わざわざ面倒な対応を避けるという選択肢も考えられます。

今回のスパムサイトの中で問題になりそうな点は、「記事をそのままコピーされたこと」と「被リンクを張られていること」の2点です。

記事のコピー

記事をコピーされるということは、重複コンテンツに該当する可能性があります。重複コンテンツとは、全く異なるURLのページに同一の記事内容が表示されている状態を指します。Googleは検索結果に対して同一のコンテンツが複数表示されると、検索におけるユーザビリティを低下させると考えています。そのため、重複コンテンツが存在した場合、それらのページを検索結果から除外するという方法を採ります。

そこで問題になることは、記事をコピーしたサイトが検索結果に表示されて、オリジナルのサイトが非表示になる可能性はないかということです。Googleは、記事の公開日時やリンク構造など、様々な条件を勘案してオリジナルコンテンツを決定します。例えば、オリジナルサイトであれば、基本的に記事の公開日時はコピーサイトよりも早くなります。また、今回の例のように引用元として被リンクが張ってあれば、被リンクを張られた側がオリジナルであると推定されます。結果として、コピーサイトがオリジナルサイトよりも検索結果の上位に表示されない仕組みになっているのです。

しかし、アルゴリズムによって機械的に判定している以上、100%のケースに対して全て正しく判定することはできません。例えば、コピーしたサイトの方がドメインパワーやページランクが強かったり、クローラーの巡回が速くて先にインデックスされてしまえば、オリジナルサイトが負けてしまう可能性も考えられます。事実、記事のタイトルで検索をしたところ、コピーサイトの方が私のサイトよりも上位に表示されていました。これは、本来私のサイトに来るであろうトラフィックを奪われている訳で、私のサイトに対して悪影響がありそうです。

リンクの掲載

次に、被リンクを張られていることについて考えてみます。ペンギンアップデートでは、SEOを目的とした自作自演の被リンクがペナルティの対象になりました。有料リンクの購入やサテライトサイトからの過度な被リンクは、検索結果の上位に表示されないように制御が加えられたのです。今回の事例では、多数のスパムサイトから合計で600本近い被リンクが張られていました。数だけ見れば、どう考えても悪影響がありそうです。

Webの仕組み上、外部サイトに対してリンクを張ることは非常に簡単です。ブラウザのアドレスバーにはアクセスしたページのURLが表示されますから、誰の許可を得ることもなく、一瞬でリンクを設置することができてしまいます。そのため、Googleのアルゴリズムでは、スパムサイトから一方的に張られたような被リンクは無視するように制御されています。

しかし、逆SEO(ネガティブSEO)が問題になっていることも事実です。逆SEOとは、通常のSEOの概念とは反対に、検索順位を落とす目的で行われる手法です。例えば、低評価のページから質の低いリンクを大量に送ることで、ライバルサイトの検索順位を下落させる方法があります。

逆SEO

今回の私の事例は、まさに逆SEOの手法に該当します。サイト内にある数千ページの全てがコピーコンテンツで自動生成されており、どう考えても低評価のページです。その低評価のページから張られているリンクは「質の低いリンク」ですから、意図したものかは別として逆SEOの被害にあっている可能性も否定できません。

DMCA侵害の申し立て

もし、自分のサイトの記事が無断転載されてしまった場合、最終手段としてはDMCA侵害を訴えることができます。DMCAとは、「デジタルミレニアム著作権法」を英語表記した場合の略称で、著作権を侵害するコンテンツに対して削除の申し立てをすることができる法律です。

DMCA侵害を申請するためには、「著作権侵害の報告」のURLにアクセスし、氏名やサイトのURL、著作権侵害の状況などを入力していきます。そして、フォームに入力した内容が送信され、著作権侵害が認められれば、Googleのインデックスから削除されて検索結果には表示されなくなります。

そして、インデックスを削除した後、Googleはそのことを「Chilling Effects」という団体に伝えます。見たことがある人もいるかもしれませんが、検索結果の下部には著作権侵害のクレームに基づいて検索結果の一部が除外された旨のメッセージが表示されます。

DMCA侵害

今回の件に対してもこのDMCA侵害を申し立てれば良いと思ったのですが、結果的には別の手段を選びました。

検索結果に表示される上記のメッセージにある「クレームを確認」というリンクをクリックすると、「Chilling Effects」のサイトに遷移します。そこには、誰の申請に基づいて、どのURLを検索結果から除外したのか表示されています。

つまり、DMCA侵害の申し立てが受理されれば、Chilling Effectsのサイトを経由して、自分の氏名と運営しているサイトが全世界に公開されてしまうのです。実際に、DMCA侵害の申請フォームには以下の一部が記載されています。

個人連絡先情報は Chilling Effects によって公開前に通知から削除されるが、多くの場合、個人名は削除されないことも理解しています。

健全なサイトを運営しているならまだしも、アダルトサイトを運営している場合には氏名なんて公表したくありません。法人としてサイトを運営しているのであれば企業名が公開されるようですが、個人で運営していれば個人名が公開されます。また、当然ですが偽名を使うこともできません。DMCA侵害の申請フォームには、虚偽の記載があったり、著作権侵害がないのに申請を行った場合には、損害賠償を支払う可能性があることが明記されており、偽りがないことを宣誓する署名まで行います。

そもそも、Chilling Effectsというサイトが厄介です。これは、米国で設立されたオンライン上の表現の自由を守るためのサイトなのですが、調べてみる限り、どうも守る対象は「コピーをした方」なのです。表現の自由に基き、正当な権利の中でインターネット上で発言をしたと仮定します。その際、第三者から「それは違法な発言であるから削除しなさい」と脅迫されてDMCA侵害が申し立てられた場合、正当な権利の基で発言した人の表現の自由が侵害されたことになります。そこで、DMCA侵害が申し立てられたことをインターネット上で広く公開し、必要であればそれに反論できる機会を用意することがChilling Effectsの役割です。

スパムレポートの報告

このような背景から、DMCA侵害の申し立ては敷居が高く、そう軽々しく使えるものではありません。正直、著作権者が不利になるような仕組みには疑問を感じますが、仕方がありません。

その他の対抗手段として、今回は「スパムレポートの報告」を実施しました。その名の通り、Googleに対してスパムサイトの報告をすることができます。DMCA侵害とは異なり、スパムレポートの報告では氏名の入力が必要ではありません。

スパムレポートの報告」のページにアクセスし、不正行為があるウェブページのアドレスやスパムサイトの状況などを入力して送信すれば完了です。

スパムレポートの報告

注意点としては、スパムサイトのインデックスが削除されるとは限らないということです。Googleは、スパムレポートに優先順位をつけて、影響度の大きい悪質な事例から順に対応を行います。しかし、対応を行うといっても、類似のスパムサイトが今後検索結果に表示されないようにアルゴリズムを修正するために参考にされるだけで、特定のサイトに対してインデックスの削除を約束するものではありません。著作権侵害に基づいてインデックスの削除を依頼したい場合には、先ほどのDMCA侵害の申請が適しています。

私のサイトは大量のドメインから無断転載を受けていたため、一応分かる範囲で全て記載しました。Google Search Consoleの「サイトへのリンク」はタイムラグが結構あるので、実際にはもっと多くのドメインがあると思います。苦労したのは、入力できる文字数が何故か全角150文字以内となっているため、ドメイン名を一度に全部記載できなかったことです。そのため、数回に分けてスパムレポートの報告をしました。

リンクの否認

Google Search Consoleには「リンクの否認ツール」が存在します。これは、既に張られているリンクを評価しないようにGoogleに対して伝えることができるツールです。リンクが持つSEO上の良い効果も悪い効果も全て無視するという訳です。今回は、スパムサイトから一方的に大量の被リンクがついており、それによってSEO上悪影響を受けている可能性があるため、リンクの否認を実施してみました。

まずは「リンクの否認」ページにアクセスし、ドロップダウンリストから対象のWebサイトを選択した後に、「リンクの否認」ボタンをクリックします。

リンクの否認手順1

次に、否認したいリンクだけを含むテキストファイル(拡張子が.txt)を作成します。ファイル名は何でも構いません。1行につき、否認したいリンクを1つ記載します。また、先頭に「domain:」をつけてその後にドメイン名を記載すれば、ドメイン単位に否認することが可能です。私の場合、ドメイン単位で一気に否認してしまいました。以下は、テキストファイルのイメージです。※実在するサイトとは一切関係のない架空のアドレスです

リンクの否認ファイル

なお、テキストファイルのエンコード方式は「UTF-8」または「7-bit ASCII」と決まっているため、テキストファイルを保存する際はエンコード方式に注意しましょう。※「ファイル」⇒「名前を付けて保存」から文字コードを指定できます

エンコード方式

否認したいリンクやドメインを含んだテキストファイルが完成したら、後はそれをアップロードするだけです。以下の図では、既にアップロードが完了した後の画面になっていますが、「ファイルを選択」から先ほど作成したテキストファイルを選択し、「送信」ボタンをクリックすれば完了です。

リンクの否認手順2

今回は、実験的な意味も込めてリンクの否認を行いましたが、原則このリンクの否認は行うべきではないとされています。なぜなら、サテライトサイトなどから自分で張ったリンクであればGoogleに頼るのではなくて自分でそれを外すのが役目であるし、外部サイトから悪質な被リンクが張られているのあれば、先述した通りGoogleは基本的にそれを無視するからです。

もし、被リンクとしてSEO上メリットを享受しているのに悪質な被リンクだと勘違いしてリンクの否認を実施してしまうと、検索順位が下落してしまう可能性があります。そのため、スパムサイトから身に覚えのないリンクが張られており、それが「低品質なリンク」であることが明確である場合に限って使うようにしましょう。

スパムサイト運営者への連絡

先述したように、スパムレポートの報告ではインデックスが削除されるとは限らないため、無断転載に関して何の対処法にもならない可能性があります。そこで、スパムサイトの運営者に、著作権侵害に基づいて記事を削除することを要請するメールを送りました。

しかし、なかなか記事を削除してもらえず、結果的には無断転載のテキスト部分についてのみ削除してもらえました。ただし、無断転載の記事タイトルと画像、また被リンクに関してはそのまま変わらずに残っていました。

一般的には、記事のタイトルには著作権が存在しないものとされています。しかし、だからといって他人が作ったタイトルを無断で自由に使える訳ではありません。ブログを運営している人なら実感していると思いますが、記事のタイトルはアクセスを集める上で非常に重要な要素になります。簡潔でインパクトのあるフレーズを埋め込めば、それだけで人々の目を集めることができ、記事のリンクをクリックしてもらえる可能性が高くなります。それ故に、我々は記事のタイトルを決めるときは頭を使いますし、工夫を凝らしています。

過去に、読売新聞の記事の見出しがインターネット上に無断で転載されたとして裁判を起こした事例があります。この判決では、見出しにも価値があることが実情であり、法的な保護に値するとして、損害賠償請求が認められました。このように、記事のタイトルであったとしても、過度に悪用すれば不法行為が認められるケースもあるのです。

また、被リンクに関しては、無断で掲載してはいけないというルールはありません。現に、ニュースサイトやソーシャルブックマークなど、被リンクを無断で掲載しているケースは多いですし、私のサイトでも外部リンクを沢山張っています。

しかし、やり取りを重ねる内に、スパムサイトが全て閉鎖していました。インデックスからも削除されていたため、スパムレポートが効果を発揮した可能性もあります。一安心していたのもつかの間、暫くしてから新たなドメインを取得して、再度大量に無断転載をされていました。仕方なくメールで問い合わせたところ、やっとページを削除してくれました。懲りずに何度も無断転載を繰り返しているため、今後も無断転載をされる危険性があります。

まとめ

アフィリエイトで長年Webサイトを運営していれば、色々なことが起きます。これまでも、正しい引用という形で記事をコピーされていた経験はありましたが、ここまで大規模に無断転載されていたケースは初めてでした。

今回は、スパムレポートの報告、リンクの否認、スパムサイト運営者とのやり取りを行い、無断転載の排除を試みました。これらの手法を安易に乱用することは良くありませんが、完全にスパムサイトと思われるサイトから悪質な著作権侵害を受けており、それによって自身のサイトが悪影響を受けていると思うのであれば、躊躇せずに対抗策を講じることも選択肢に入れるべきだと思います。また、それと同時に、自身も知らず知らずのうちに他人にとってのスパムサイトになっていないか常日頃注意しながらサイト運営を続けることが大切だと感じました。

 - アクセスアップ, アフィリエイトの稼ぎ方