読者です 読者をやめる 読者になる 読者になる
スポンサーリンク

掲示板などUGCのSEOで,固定リンクのURLパラメータ内に任意の文字列をGETリクエストで埋め込む場合,低品質なページが動的に生まれるリスクに注意

Google SEO web webサービス サーバ セキュリティ トラブル マネジメント 翻訳 自然言語処理・テキストマイニング

Webサイトを作っていて,掲示板など「ユーザ参加型」のコンテンツのSEOには要注意。

「ユーザが作成したコンテンツ」(UGC,CGM)のSEOは難しいのだ。

簡単に管理できる例:静的なデータ,スパムコメント

たとえばブログのスパムコメントのように,

明らかにページ評価を下げるもの。

これは,Webサイト内にデータが残るので,発見も対処もしやすい。


またWikiのように,ユーザ参加型のページ生成システムだと

変な内容を書かれた時に,サイトの評価がガクンと下がる。


あのMozillaでさえ,UGCのせいでGoogleからインデックス削除されている。

Mozilla、UGCスパムが原因でGoogleから手動ペナルティを喰らう | 海外SEO情報ブログ
https://www.suzukikenichi.com/blog/mozilla-gets-penalized-due-to-ugc-spam/

  • mozilla.orgがGoogleの手動対応によって一部のページをインデックスから削除されました。
    • ユーザーが作成したコンテンツに, スパム的な内容が含まれていたことが原因です。


組織ぐるみでやらせを行ない,嫌がらせコメントを大量につけて評判を操作したりする例もある。

ユーザー作成コンテンツ(UGC・CGM)の釣り・やらせの危険性と成長鈍化・失速 ☆E☆相棒
http://advocacy.blog.shinobi.jp/%E5%8F%A3%E3%82%B3%E3%83%9F%E3%83%BB%E3%83%90%E3%82%A4%E3%83%A9%E3%83%AB%E3%83%9E%E3%83%BC%E3%82%B1%E3%83%86%E3%82%A3%E3%83%B3%E3%82%B0%E3%83%BBsmo/%E3%83%A6%E3%83%BC%E3%82%B6%E3%83%BC%E4%BD%9C%E6%88%90%E3%82%B3%E3%83%B3%E3%83%86%E3%83%B3%E3%83%84-ugc%E3%83%BBcgm-%E3%81%AE%E9%87%A3%E3%82%8A%E3%83%BB%E3%82%84%E3%82%89%E3%81%9B%E3%81%AE%E5%8D%B1%E9%99%BA%E6%80%A7%E3%81%A8%E6%88%90%E9%95%B7%E9%88%8D%E5%8C%96%E3%83%BB%E5%A4%B1%E9%80%9F

  • CGMには、簡単に暴かれる企業によるやらせも多い。
  • はてなブックマークは、人気・注目記事の数的指標がユーザーによるブックマーク数だけ
    • なので、ブックマーク数を上げ底するのは非常に簡単だ。
    • 大企業なら, 社員やアルバイトを使って簡単にブックマーク数を量産できるだろう。


まあ,これらのタイプのUGCだったら,

サイト内のデータをひたすら統制,監視,修正することで,かろうじて対処してゆけるだろう。


手動運用などによって投稿を監視し,良いコンテンツだけを残すのだ。

UGCサイトのウェブ担当者の重要な務めはコンテンツ監視 | 海外&国内SEO情報ウォッチ | Web担当者Forum
http://web-tan.forum.impressrd.jp/e/2015/12/18/21759/page/1?

  • 掲示板サイトで、投稿のなかに低品質なコンテンツがあったとしたら、私たちはそれもコンテンツの一部だとみなす。
    • 掲示板のユーザーが作ったものだから無視しようとは考えない。
    • サイト管理者が責任を負っているものだと考える。
  • フォーラムに限らず、ユーザーがコンテンツを作成するいわゆるUGCサイトは、ユーザーが作ったコンテンツの監視が非常に重要。
    • 良いコンテンツだけを残せば素晴らしいサイトになる
    • 悪いコンテンツばかりが目立てば, ユーザーにも検索エンジンにも評価されないサイトになる。

見つけづらい例:GETパラメータに応じて動的に変化するページ

しかし問題は,「URLのGETパラメータに任意の文字列を埋め込み可能」な場合。

辞書や翻訳サイトなどが挙げられる。

URLに入れた任意の文字列に応じて,ページの内容も変化し,固定リンクが残る形式だ。


この場合,URLの中にスパム文字列を埋め込まれてしまい,

結果として「ポリシー違反の低品質コンテンツ」が生成され,

それがGoogleにインデックスされて,サイトの評価が下がる可能性がある。


Webサイト自身は「変なデータ」を保有していないのに,

外部からのデータ埋め込むによって,動的に「変なデータ」を生成してしまうわけだ。

これは管理しづらい。


動的に生成されるコンテンツなのに,静的な固定リンクがずっと残る

というのが問題点。


対策としては,動的に生成されたデータに対して何らかのバリデーションやチェックをかけることだ。

もしも変なデータが生成されそうになったら,「このデータは表示できません」とし,

低品質なコンテンツの生成を未然に防ぐこと。


こうすれば,「良いコンテンツだけを残す」ことができる。


悪いコンテンツが生まれる可能性を心配するあまり,

UGCのアイデア自体をあきらめてしまうのは,あまりにもったいない。


静的コンテンツであれ,動的生成コンテンツであれ,

「良いものだけをフィルタして残す」という大原則は一緒だ。

品質の高いページを作るために,あらゆる工夫をこころがけてゆこう。

コメントも含めたページ全体のコンテンツが品質評価される | 海外SEO情報ブログ
https://www.suzukikenichi.com/blog/comment-is-a-part-of-content/

  • UGCは多くの価値を提供しうる。
    • 質の低いUGCが多少あるからといってUGC自体を無効にしてしまうのは、ほとんどのサイトではやり過ぎ
    • スパムコメントが少しあったからといって、ブログのコメントをすべて削除してしまうのはもったいない