マーケティング

Googleの「検索アルゴリズムの仕組み」から、SEOに寄与するパラメータを抜粋してみる

Googleが公開しているいくつかのドキュメントの中に、「検索アルゴリズムの仕組み」というページがあります。

ネット上には「これをやるとSEOに有効!」「これがGoogleに評価される!」といった、SEOのパラメータに関する記事がたくさんありますが、中には根拠に乏しい内容や、明らかに間違った内容も散見されます。

そういったウソに騙されないためにも、まずは素直にGoogle自身が語る検索アルゴリズムの仕組みに耳を傾けるべきだと思います。Googleが作ったアルゴリズムなので、少なくともGoogleが言ってることは正しいはず。

原文を見ながら、「このパラメータはSEOに寄与する」と書いてある部分を抜粋していこうと思います。

検索意図の把握

▼原文

最適な回答を返すためには、検索の意図を把握することが大切です。関連性の高い情報が含まれているページを見つけるために最初に行うのは、検索クエリに含まれる単語の意味の分析です。 Google では、どの単語をインデックスで検索する必要があるのか解釈するための言語モデルを構築しています。

ここでは、スペルミスを解釈するのと同じくらい単純に見える手順を行います。さらに、自然言語理解に関する最新の調査結果の一部を適用することで、入力されたクエリのタイプを理解しようと試みるのです。たとえば、1 つの単語に複数の定義がある場合でも検索がユーザーの意図を理解できるのは Google の類義語システムのおかげです。このシステムは開発に 5 年以上かかりましたが、さまざまな言語の検索の 30% 以上で大きな成果を上げています。

Google では、ユーザーがどのような種類の情報を探しているのかについても理解しようとします。特定のことに関する検索か、幅広い検索か。「口コミ」、「画像」、「開店時間」など、具体的な情報が必要なことを示す検索キーワードはあるか。その日に公開されたコンテンツを探していることを示す、急上昇ワードの検索をしているか。付近のお店や現在地の情報を検索しているか。こうしたことも、アルゴリズムで分析します。

急上昇中のキーワードを検索すると、フレッシュネス アルゴリズムによって最新の情報が求められていると解釈され、より鮮度の高いページが古いページより上位に表示されます。たとえば「J リーグの試合結果」、「M-1 グランプリの優勝者」、「トヨタの決算発表」などが検索されたときは、できるだけ新しい情報を表示するようにしています。

https://www.google.com/intl/ja/search/howsearchworks/algorithms/

▼抜粋

・Googleは検索クエリに含まれる単語から、検索意図を理解しようとする。

・Googleはユーザーがどんな種類の情報を求めているか理解しようとする。
 (検索クエリの分類でよく言われる「Know・Go・Do・Buy」はここにあたるのかも)

・急上昇キーワードの場合は情報の鮮度が重視される

ウェブページの関連性

▼原文

次に、クエリに一致する情報が含まれるウェブページを探します。ごく基本的な検索を行った場合、アルゴリズムはインデックス内で検索キーワードを探して適切なページを見つけます。そして、そのキーワードが登場する頻度やページ上の場所(タイトル、見出し、本文中など)について分析します。

情報の関連性を評価するための最も基本的な要因は、検索クエリと同じキーワードがウェブページに含まれているかどうかです。キーワードがページに出現する(特に見出しや本文に含まれている)場合、そのページの情報は関連性が高い可能性があります。このようなキーワードの単純な一致に加え、匿名化して集計したインタラクション データに基づいて検索クエリと検索結果の関連性を評価することもしています。インタラクション データを関連性要因に変換して機械学習することで、関連性をより正しく推定できるようになります。

キーワードの照合に加えて、アルゴリズムでは、ユーザーが探している情報に十分合致する検索結果となるかどうかを評価するための手掛かりを見つけます。「犬」を検索する場合、必要なのは「犬」という単語が何百回も出現するページではありません。つまり、ただクエリの言葉を繰り返すだけでなく、クエリに対する答えが含まれているページかどうかを見極める必要があります。そこで検索アルゴリズムでは、犬の画像や動画、犬種のリストなど、関連するコンテンツがページに含まれているかどうか分析します。最後に、クエリと同じ言語で作成されたページかどうかを確認して、ユーザーが使用する言語のページを優先します。

なお、Google 検索アルゴリズムではこうした定量化可能な要因に基づいて関連性を評価していますが、ページのコンテンツの主観的概念(視点や政治的な偏向)を分析するようには設計されていません。

https://www.google.com/intl/ja/search/howsearchworks/algorithms/

▼抜粋

・検索キーワードが「タイトル・見出し・本文など」に含まれていると、関連性が高いと可能性があると評価する

クエリに対する答えとなる画像や動画、リストなどが含まれているかを分析する

コンテンツの品質

▼原文

一般的な検索クエリの場合、関連がありそうな情報を掲載しているウェブページは、数千件どころか、場合によっては数百万件も存在します。検索クエリに対して最適なページを検索結果の上位に表示できるように、これらのウェブページの有用性を評価するためのアルゴリズムも作成しています。

これらのアルゴリズムでは、ウェブが提供できる最適な情報を特定するために、コンテンツの新しさ、検索キーワードが出現する回数、ページのユーザー エクスペリエンスの質など、さまざまな異なる要因を分析します。また、内容の信頼性や権威があるかどうかを評価するために、同様のクエリについて多数のユーザーに評価されているサイトを見つけます。検索内容に関連する他の著名なウェブサイトがそのページにリンクしている場合は、情報の質が高いことの確かな証拠となります。

ウェブ上には、キーワードを何度も繰り返す、PageRank を転送するリンクを購入するなどの手法を使って、何とか検索結果の上位に入ろうとするスパムサイトが多数存在します。こうしたサイトは、利用価値がほとんどないばかりか、Google のユーザーに害を及ぼしたり誤解を与えたりする恐れもあります。そこで Google では、スパムサイトを特定したり、Google のウェブマスター向けガイドライン(品質に関するガイドライン)に違反するサイトを検索結果から削除したりするためのアルゴリズムを開発しています。

ウェブをはじめ、あらゆる情報源のコンテンツは常に更新されています。Google では、システムの品質を継続的に測定、評価することで、情報の関連性と権威性のバランスを適正に保ち、検索結果の信頼性を高めていきたいと考えています。

https://www.google.com/intl/ja/search/howsearchworks/algorithms/

▼抜粋

コンテンツの新しさ・キーワードの出現回数・ユーザ体験の質を評価する

・信頼性や権威性を調べるために、質の高い外部からのリンクを評価する

・スパムサイトやガイドライン違反のサイトを排除する

ユーザビリティ

▼原文

検索結果を表示する前に、Google ではすべての関連情報に整合性があるかどうかを評価します。たとえば、検索結果に共通する話題は 1 つだけか、それとも複数あるのか、多数のページが限定的な 1 つの解釈に集中していないか、といったことです。Google は、検索のタイプに応じて最も利便性の高い形式でさまざまな情報を表示することに努めています。また、ウェブの発展に合わせて Google のランキング システムも進化させ、より多くのクエリに対して質の高い検索結果を提供できるようにしています。

ユーザビリティを評価する際の要因としては、サイトを異なるブラウザで正しく表示できるか、パソコン、タブレット、スマートフォンなどタイプやサイズが異なるすべてのデバイスに最適化されているか、インターネットの接続速度が遅いユーザーでもページをスムーズに読み込めるかなど、すべての Google ユーザーが検索結果をストレスなく表示できるかどうかが重要となります。

サイトのユーザビリティはサイト所有者が改善できるものであるため、対応が可能な重要な変更を検索アルゴリズムに加える場合は前もって周知するよう努めています。たとえば 2018 年 1 月には、検索アルゴリズムでサイトの Page Speed を考慮することを決定し、変更を実施する 6 か月前に発表しました。また、サイト所有者が適切に対応できるように、PageSpeed Insights や Webpagetest.org のような詳しいガイドやツールを提供し、サイトをよりモバイル フレンドリーにするには何を変更すべきかがわかるようにしました。

https://www.google.com/intl/ja/search/howsearchworks/algorithms/

▼抜粋

・検索結果がどれも1つの解釈に偏らないように、様々な情報を表示するように努める?(自信なし)

マルチブラウザ対応・レスポンシブ・高速化されたサイト(ストレスの無さ)を評価する

・ユーザビリティについての指標やツールは公開するので活用せよ

文脈の考慮

ここは割愛します。ようするにユーザーのパーソナライズを検索に使用していますって話ですね。

まとめ

Googleが全てのパラメータを公開しているわけではないと思いますが、少なくともここに書かれていることは評価されるパラメータであるはずです。(だってそうGoogleがそう書いてるから)

ユーザーの問い(クエリ)に対して、いかに的確な回答を検索結果として返せるかどうかをGoogleは追及しているということが、読んでいるとあらためてわかります。このGoogleのポリシーを常に念頭に置きながらコンテンツづくりに取り組みたいと思います。