スポンサーリンク

Google検索エンジンのアルゴリズム(hummingbird)を把握し,SEOのキーワード分析手法に役立てよう

SEO対策において,
「検索エンジン側」と「Webサイト側」の両方で,
理解しておくべきポイントがある。

アクセス解析のログをキーワード分析にかける時,
検索アルゴリズムの要点や分析手法として,
下記の点を念頭に置くこと。

現時点で,検索エンジン側で重視しているポイント:

  • 今ではハミングバードにより,「会話型の長いクエリ」にも対応させている。つまり,「複合キーワードや5W1Hの組み合わせ」で疑問文や質問文を作った場合の,精度の高い検索。
  • サイトが高評価を得るためには,被リンクの「質」に注目。リンクがキーワードを含み,なおかつ多数の分散したIPアドレスからリンクされているか。


Webサイト側で対策すべきポイント:

  • リンク元のキーワードは,ビッグキーワードとスモールキーワードに分類し,それらのセット(複合語)での高ランクを考えよ。
  • 各キーワードに対して,新規率も直帰率も低い,という状態を目指せ。これが,コンテンツがユーザのニーズにマッチしている状態。そういうコンテンツを作成せよ。


以下は根拠となるページ。各アルゴリズムや分析手法が解説されている。


さいきんのGoogle検索エンジンのアルゴリズムについて:

【SEO図解】ノンエキスパートのためのGoogleアルゴリズム構造図(ハミングバードとは?) - WEB戦略ラウンドナップ
http://www.roundup-strategy.jp/mt/arc...

  • 見やすい図で解説。そして,2013年には,ど真ん中が今までのページランクアルゴリズムからハミングバードに置き換え。今回のようなアルゴリズムの大きな変化は過去初めて
  • 大まかな流れの説明:
    • まず,クローラが収集した被リンク数などのサイト情報を基に,基本的な検索順位や絞り込み方法をシンプルに決定
    • 次いで,サイトのテーマを判別して,テーマについて「関連性のあるサイト」である,とチェックした上で,ランクを決定
    • また,サイトに関連した画像・ソーシャル・地理地域情報などの付随情報をくっつける
    • 最後に,ペナルティや削除すべき情報をフィルタリングして除去。そして検索結果として出力


Googleの新しい検索アルゴリズム(ハミングバード)と今後のSEO対策 | MarkeStyle(マーケスタイル)
http://markestyle.com/google_hummingb...

  • ハミングバードの特徴:
    • より会話に近い言葉での検索で,精度が向上する。疑問文や質問文など,Siri等で利用されそうな自然言語を介した検索
    • 分かりやすい複合語(1、2キーワード程度)では影響なし。したがって,アクセス解析のリンク元キーワードを見ただけでは気づかない場合も。
  • Googleの検索アルゴリズムには、Author Rank(オーサーランク)という考え方もある
    • コンテンツを作成する著者を評価
    • ソーシャル活用などのブランディングが必要


Google最大級の検索アルゴリズム、Hummingbird(ハミングバード)
http://blog.mf-seo.com/archives/10020

  • このアルゴリズムは,検索クエリの長い,会話型検索に影響を与える
  • 単一キーワードから、より詳細な情報を得る為に2語、3語と複合キーワードと増えていった
  • さらにsiriの普及という背景もあり,文章のような検索キーワードを打つユーザーが増えている


2010年版SEO体得講座 :連載|gihyo.jp … 技術評論社
http://gihyo.jp/design/serial/01/seo2010

  • 2010年7月,GoogleがYahooに検索エンジンで提携と発表。Googleの検索結果がベースとなり,そこにYahoo独自の味付け
  • 検索エンジンの基本的な部分は,下記の2つの指標を評価する。まとめて言うと「たくさんのドメインからキーワードに関連したリンクが多ければ多いほど高評価」
    • 「キーワード関連度」=そのページとキーワードとの関連性の高さ。
      • そのページ自体の内部が,キーワードと関連性があるか。titleタグの文言は非常に大事
      • そのページの被リンクのアンカーテキストにキーワードが含まれるか
    • 「ページ重要度」=そのページの注目されている度合い。ページランクとか。
      • 被リンクの質(分散してリンクされていることが望ましい。指標名は,被リンクドメイン数,被リンクIP数。)
      • 被リンクの量。 最近では量よりも質が大事。被リンクページもSEO対策用の分析の対象とすること
  • 同一キーワードで検索した際の,競合サイトの様子をよく観察せよ
  • ほとんど検索されないキーワードで上位表示されてもSEO対策として意味がない。だから,
    • まず,よく検索されるキーワードを選んで
    • そのキーワードについて上位表示されること。
  • ペナルティ注意点:
    • リンク切れを作るな。また,「スパムサイトにリンクを提供しているサイトにもペナルティが課せられる」と考え,スパムサイトとは一切関わりを持たないこと
    • 同一サイト内に,重複タイトルを設けないこと
  • キーワードは「ビッグキーワード」と「スモールキーワード」に分けて考えよ。前者に基づくアクセスは,被リンクなどの外部要因に左右される


本当は教えたくない『Googleのアルゴリズムを逆手に取って上位表示を狙う方法』
http://www.masteraxis.com/google_qdd....

  • ビッグキーワードだけで検索されて,ユーザの意図が分からない場合がある
  • そういう時に,検索結果に多様性を持たせることで、ユーザビリティーをアップさせるアルゴリズムが「QDD(Query Deserves Diversity)」。ユーザーの目的がキーワードから読み取りにくい場合に発動
  • 関連検索ワードは検索ユーザーの「ニーズ」なので活用すること


ここまでを前提として,検索エンジンの基本的な処理が分かった。

以下は,アクセス解析時のキーワード分析のアルゴリズム。

R による検索キーワードのアソシエーション分析 - 廿TT
http://abrahamcow.hatenablog.com/entr...

  • GNU Rによるサンプルコード。複合キーワードの掛け合わせ状況を調べる


R による検索キーワードのネットワーク分析 - 廿TT
http://abrahamcow.hatenablog.com/entr...

  • 矢印の向きは検索キーワードの語順として,有効グラフを生成するサンプルコード


散布図を使ったアクセス分析 - リアルアクセス解析
http://d.hatena.ne.jp/ryuka01/2009030...

  • 検索ワード×新規率,検索ワード×直帰率 を算出する。そして高低でマトリックスを作成して分析する,という手法
  • 新規率が低ければ,そのキーワードでのリピータが多い
  • 直帰率が高ければ,ユーザのニーズとサイトのコンテンツがマッチしていないので,ページ内にユーザの探しているものが見つからない。そういうコンテンツは作るな。
  • あるキーワードについて,新規率も直帰率も低ければ,ユーザーニーズとサイトコンテンツが合っている。ここがゴールであり,SEOの目的として,この状態を目指すこと。

関連する記事:

SEO時,アクセス解析ツールの利用目的は,ユーザについての仮説を検証すること
http://computer-technology.hateblo.jp/entry/20140118/p1