ウェブマスターオフィスアワー

2019年3月7日に行われたGoogleウェブマスターオフィスアワーの質問と回答をまとめました。
前提として、2月のフリーランス向けイベントで回答できなかったものを今回紹介しています。

個人的に注目の質問は、「しごと検索のアルゴリズム」です。
ぜひ参考にしてください。

Canonicalタグは企業サイトに必要か

【質問】
Canonicalタグは通常の企業サイトにも必要ですか?また、その場合全ページに設置が必要ですか?
(もしくは多言語サイトのSPとPCが分かれているときだけなどの使用で大丈夫ですか?)

【回答】
前提としてCanonicalタグはどのサイトでも有効である。
必ずしも絶対にやらなくてはいけないものでもない。
Googleが同じようなコンテンツが複数URLであった場合、どのページがメインページかを把握するための有効な手がかりになる。

metaタグのキーワードは必要か

【質問】
metaタグのキーワードは重要視されていないとのことですが、なくても大丈夫ですか?それともないよりあった方が良いですか?

【回答】
なくて大丈夫。検索には全く使っていない。

ページ内テキストは最低何文字以上が推奨か

【質問】
昔からページ内のテキストは最低○○文字はあった方が良い、といった記事を多く見かけますが本当ですか?その場合最低何文字が推奨でしょうか?

【回答】
1文字以上はあった方がよい。
文字数は関係なく、必要な長さでユーザーにとって読みやすいと思われる文章で書く。

ページ内テキストのボリュームに関する傾向

【質問】
一昔前だと、SEO対策としてテキストのボリュームをとにかく多く入れるという法則があったように思いますが、現在のユーザーのために、という視点でみればそのトレンドは変わってきているのでしょうか?

【回答】
Googleとして文字数のガイドライン、指針は出してない。
気にしないで必要と思われるコンテンツを書く。

スピード計測ツール結果の検索結果への影響

【質問】
PageSpeed InsightsやLighthouseの点数は検索結果に影響を及ぼしますか?

【回答】
表示速度は去年のスピードアップデートでランキングに影響を及ぼすが、PageSpeed InsightsやLighthouseのスコアが直接の指標とはならない。

AMPを導入するべきですか?

【質問】
AMPを導入すべきか迷っています。どういったサイトの場合に導入すべきでしょうか?通常の企業サイト(お知らせにWordPressを導入している場合など)でもAMPの導入は必要でしょうか?

【回答】
どのような企業サイトを運営しているか、どういったリソースがかけられるか、を考えて検討するのがよい。

キーワードによる表記ゆれを集約すべきか

【質問】
キーワードによる表記ゆれを集約したほうがよいでしょうか?ユーザーにキーワードを入力してもらう項目が多く、分散しがちで検索結果がうまく上がりません。

【回答】
有効な対策はないが、単純に表記ゆれを気にせず、そのキーワードに対してよいコンテンツを作ることに尽きる。

Search Consoleの警告と手動対策の関係

【質問】
Google Search Consoleでカバレッジなどの警告が発生すると検索順位に対してペナルティが発生するなどのことはあるのでしょうか?

【回答】
インデックスカバレッジレポートを指していると思われるが、クロールインデックスに関する問題を報告しているに過ぎないので、いわゆる手動対策・自動対策のペナルティとは別の話。
手動対策の対象にはならない。

スマートフォン版の検索結果の確認方法

【質問】
スマホの検索結果とPCの検索結果が異なるという話ですが、スマホの検索結果画面を確認するために、PCのユーザエージェントを変更することで確認可能でしょうか?

【回答】
確認可能。
Chromeのデベロッパーツールでも確認できる。

IPアドレスでなく、ドメインを表示させたい

【質問】
Google検索の結果、サイトのURLがドメインではなくIPアドレス側が表示されるのですが、これをドメイン側が表示されるようにする方法はありますでしょうか?

【回答】
IPアドレス側からドメイン側へ普通に301リダイレクトをする。

Google検索の最新情報の入手方法

【質問】
Google検索に関する最新情報を入手するためには、どのような手段が有効でしょうか?

【回答】
Googleウェブマスター向け公式ブログが一番よい。
https://webmaster-ja.googleblog.com/

ツイッターも参考に。
金谷氏:https://twitter.com/jumpingknee
あんな氏:https://twitter.com/piropiroanna

しごと検索の始め方

【質問】
先日リリースされた求人サーチは何もしなくてもグーグルが解釈して表示されるのでしょうか?

【回答】
なにもしなくてよい訳ではない。
Google検索のリファレンスドキュメントにJobPostingの実装方法が書いているので参照。

jobposting
https://developers.google.com/search/docs/data-types/job-posting

サテライトサイトとサブドメイン

【質問】
サテライトサイトと同様に、サブドメインも同じでしょうか?

【回答】
イベントの質問、リンクスパムの話。
サテライトサイトからのリンクの場合、たいていの場合は不自然なリンク、つまりガイドラインに違反しているリンクが多い。
それを前提で、サブドメインの場合は、掲載順位を上げる目的よりは、サイト内の遷移、コンテンツ間のリンクは普通のことであるので、サテライトサイトからのリンクとは少し違う。
掲載順位を上げる目的であればサブドメインからのリンクも注意する。

回答が終了したQ&Aページの構造化データ

【質問】
2月4日にQ&Aページのコンテンツガイドライン(英語版)が更新されたという情報を拝見しました。
ユーザーが投稿できないページでの構造化マークアップはガイドライン違反ということですが、一定期間で回答募集が終了するQ&Aページは「投稿できない」ステータスになりますが、その場合の構造化マークアップは残しておいてOKでしょうか?

【回答】
ユーザーから寄せられたものであれば、Q&Aページの構造化データは残しておいても問題ない。

Q&Aページの構造化データマークアップは、ユーザーが複数投稿できるページが対象。
コンテンツガイドライン参照

コンテンツガイドライン
https://developers.google.com/search/docs/data-types/qapage?hl=ja

サイトマップが送信完了しない

【質問】
はてなブログを利用しているのですが、サイトマップを登録しても、「取得できませんでした」というステータスになってしまいます。
はてなブログのsitemap.xmlでは、100件ごとに纏めたドメイン/sitemap.xml?page=1やドメイン/sitemap.xml?page=2という形のサイトマップを子階層にした形となっています。
ドメイン/sitemap.xml?page=1やドメイン/sitemap.xml?page=2を個別にサーチコンソールに登録すれば、ある程度現象は改善されるのですが、それでも一部で「取得できませんでした」というステータスになってしまいます。
サイトマップの使用を詳細には知らないのですが、はてなブログ側のサイトマップが仕様に沿っていない作りなのでしょうか?それともGoogle側のXMLサーバに問題があるのでしょうか?
ウェブマスターフォーラムの回答やネット上にある同様の悩みを抱えている方の記事を読んだ方の中には、ドメイン/sitemap.xml?page=1を利用することで解消していると思っている方もいるようですが、
これだと最新の100件しかサーチコンソールに情報を送信できません。記事・コンテンツ数が多い場合には、適さない解決方法だと考えますので、根本原因を確認したく質問させて頂きました。

【回答】
はてなさん側に問合せいただくのがよい。

Recipeの構造化データで手順の記載方法

【質問】
Recipeの構造化データマークアップについて、ガイドラインには次のように書いています。

>料理の作り方に関するテキストのみ含めて、
>それ以外のテキスト(「指示」、「動画を見る」、「手順1」など)は含めないでください。
>これはフレーズは構造化データの外部で指定する必要があります。

つまり
「手順1.卵を混ぜる」
「手順2.1.をフライパンで焼く」
と可視ページでかき、構造化データは
「卵をまぜる」
「1.をフライパンで焼く」
とマークアップする必要があります。
この場合1が何かなど分からなくなりますが、どうするのが正解ですか?
このような手順番号を使った指示は、レシピサイトでも沢山見かけます。
アメリカなど進んでいるところはどう対処しているのかも教えてください。

【回答】
手順1、手順2という結果物として指定する使い方は使われないそう。
そもそも手順番号を入れる書き方は推奨していない。

英語のレシピサイトをいくつか確認したが、
「卵をまぜる」「1.をフライパンで焼く」
ではなく、
「卵をまぜる」「その卵をフライパンで焼く」
という形で書いてある。
このようにマークアップすることが良い。

AMPでWebpフォーマットへの対応

【質問
現在、canonical AMPのページを制作中です。Webpファイル未対応ブラウザのために、代替でPNGを読み込むためのHTML記述をご教示願います。

検索すると、picture要素を使った下記の方法が見つかりました。

<picture>
<source type=”image/webp” srcset=”sample.webp” />
<img src=”sample.png” width=”400″ height=”400″ alt=”サンプル画像” />
</picture>

しかし、これはAMPページには使えないようです。

【回答】
通常ページはpictureタグでよい。
AMPページでは、pictureタグに対応したAMPコンポーネンツは今はない。
amp-imgのフォールバックで一般的なフォーマットを指定すればできる。
AMP公式リファレンスに記述もあるので確認。

AMPリファレンス
https://www.ampproject.org/ja/docs/reference/components/amp-img#example:-specifying-a-fallback-image

画像インデックスの確認方法

【質問】
画像がインデックスされたかどうかを確認する方法について質問です。
HTMLファイルの場合は「info:」でインデックスを確認できますが、画像の場合は画像ファイルのURLに「info:」を付けてもインデックス確認ができませんでした。
こちら、Googleが推奨する確認方法がありましたらお教えください。

【回答】
ツールでは特にないが、方法は2つある。
1つは単純に画像で画像を検索する(Googleイメージ検索)
画像の上で右クリック、「Googleで画像を検索する」から確認できる。
二つ目は、画像のURL分かるので、src:画像URLで検索すると、どこにどのようにインデックスされているか分かる。

しごと検索のアルゴリズム

【質問】
Googleしごと検索が日本語でも使える様になったので、実際の構造化データを加え、無事表示されるようになりました。
ガイドラインに準拠したものではありますが、よくある求人サイトと同様の「求人情報が書いてあり、応募フォームがある」程度の、簡易的なものでもあります。
質問なのですが、求人の検索順位には距離の他に、ポストされてからの時間や構造化データに記述されている検索キーワードの関連度合いなどがあると思うのですが、「掲載元サイト自体の内容や信頼性」というのは考慮されるのでしょうか。

【回答】
今言えることはない。アルゴリズムに近い質問なので。

長くなった更新履歴はどうすればいい?

【質問】
ホームページのTOPページには、記事を更新するたびに更新履歴に追記してます。しかし記述するたびに1ページあたりの文字数も多くなり、古い更新履歴は過去ページに送ったほうが良いのか迷ったのですが、ファイルを分けて作るべきでしょうか?
追記する量が増えるほど、。そのサイトの内容が薄まり、結果として何を取り扱ったサイトなのか検索エンジン上理解しづらいサイトになるという懸念を感じたのでご質問致しました。

【回答】
質問者からいただいたURLを確認したが、特に長くなかったので気にする必要はなし。
更新履歴以外の情報で何をテーマとしているサイトか分かる。
ファイルを分けれられるようであれば分けてもいい、古い情報が不要あればなくてもよい。
古い更新情報をアーカイブとしてリンクを張っておいてもよい。

スパムの疑惑のあるクラウドソージング案件

【質問】
最近、クラウドソーシングで滞在時間や遷移数を改善するためのスパムみたいな案件が見られます。こちらはかなりグレーな部分だと思いますが、報告のためのフォームなどはあるのでしょうか。またご意見をお聞かせください。

【回答】
ガイドライン違反と考えられる場合は、スパムレポートから送る。

スパムレポート

https://support.google.com/webmasters/answer/93713?hl=ja

インターネット上のモラルなどの報告については対応できない。
新しいスパムは出てくるので、スパムの報告自体は意味のあるものなので報告してほしい。

インデックスの問題について

【質問】
あるクエリにおいて上位に表示されていましたが、今月から大きく順位が落ちてしまいました。原因を探っていたところ、今までランディングされていたURLのインデックスが消えていることが判明しました。
いくつかのURLに対して「fetch as google」を実行したことろ、インデックスが戻り順位も復活したURLもありましたが、インデックスが戻らないURLもございます。加えて「URL検査ツール」で該当URLをチェックすると「URLがGoogleに登録されていません」「重複しています。送信されたURLが正規URLとして選択されていません」という結果で「Googleが選択した正規URL」にページと全く関係のないURLが表示されます。
PCでもスマホでも実際に該当ページは見れる状況ですし、robots.txtでのブロックも実行していませんが、原因がわかればご教授いただけますでしょうか?また、それぞれのURLに対して自己参照でcanonicalを設置することも検討していますが、その対応で解決する問題かも合わせてご教授いただければ幸いです。

【回答】
質問者からURLはもらった。
あるURLが別URLと重複しているため、どちらかがインデックスから削除された状態。
細かい原因は分からないが、クロールした際に「URL A」と「URL B」が、まったく同じ内容、あるいはほとんど同じ内容を返していた可能性が高い。
もしくは返せなかったたために、「URL A」と「URL B」が同一コンテンツと判断した可能性がある。
やることは、クロールした際に読み込まれないコンテンツはないか、などURL検査ツールを使って確認する。
自己参照canonicalは有効かどうかは分からないが、あってマイナスになることはないのでやった方がよい。

Google画像検索に関するおすすめの方法

【質問】
Google画像検索に関するおすすめの方法 – Search Consoleヘルプ
https://support.google.com/webmasters/answer/114016?hl=ja

↑こちらのヘルプに書かれていました「アダルトページにメタデータを追加する」のメタデータの追加を検討しています。
しかし、このメタデータを設置することによる具体的なメリットとデメリットがいまいちよく分かりません。
設置をすることによるメリットやデメリットはどのようなものが想定されますでしょうか・

【回答】
設置することでGoogleがページ内のアダルトコンテンツがあるかどうか特定しやすくなる。
例えばセーフサーチの対象として適切に対応される可能性が高い。
ないと通常の検索結果に表示される可能性があるためユーザーにとってデメリットになる。
それが防げるので設置するのがよい。

コピーサイトへの対策について

【質問】
サイト全体を丸ごとコピーされてしまいました。
[発覚の経緯]偶然にもSEOポイズニングについての記事を読んでおり、気になって調査したところ運営サイトでも同様の状況であることが発覚しました。

[発覚後の対策]コピーサイトは一般的なUser Agentでアクセスすると閲覧できませんが、googlebotのUAでアクセスすると運営サイトの完全コピーサイトを表示していることがわかりました。(Chrome Developer Toolで確認)
過去に何度かDMCA違反の申請を行ったこともあったため、以下のようなフローで実施しました。

1.ホスティング会社への連絡。CloudFlareを介しているためホスティング先がわからず断念
2.DMCA申請。詳細な内容を記載して申請を行ったが著作権違反は認めらず。限定されたUAのみに表示しているためか?この点は不明です。
3.GTMでのリダイレクト。八方ふさがりとなってしまったため考えあぐねて出した対策です。コピーサイトがGTMを含めたソースごとコピーしていたので、コピーサイトのドメインをトリガーとしてgoogle.comへ転送されるようGTM上で設定を行いまいた。

[現在の状況]とりあえずの対策として現状も3.の状態にしているのですが、Googleには未だインデックスされたままです。サイト運営者としては即時に削除したいものですが、このようなケースではどのような対策を行うのがベストか、ぜひ取り上げていただけるとうれしいです。

【回答】
クローキングにあたる。
ウェブマスター向けガイドラインを参照。
https://support.google.com/webmasters/answer/35769?hl=ja

クローキングとは
https://support.google.com/webmasters/answer/66355

クローキングとは

クローキングとは、人間のユーザーと検索エンジンに対しそれぞれ異なるコンテンツまたは URL を表示することです。クローキングは、Google のユーザーが予想した結果と異なる結果をユーザーに提供するものであるため、Google のウェブマスター向けガイドライン(品質に関するガイドライン)への違反と見なされます。

クローキングはスパムレポートとして報告してもらうと対応できる。

警告に対応しないことによる影響

【質問】
Search Consoleで「説明 このサイトの一部またはすべてのダウンロードに、「一般的ではないダウンロード」の警告が出ています。
URLの例 該当なし」
と出て、具体的な対処が見えずに困っているのですが、対処をしないことによるリスクは何が考えられるのか教えていただいてもよろしいでしょうか。
マルウェアによるリスクなのか、Google検索にインデックスされなくなるのか、ランキングに影響するのか、リスクがいまいち見えません。
フォーラムの記事も検索しましたが、決定的な回答が得られず、こちらに質問させていただきました。お教えいただければ幸いです。

【回答】
この警告があるとユーザーにインパクトがある。不適切なファイルがダウンロードされてしまう可能性がある。
サイトオーナーのリスクとして、おそらく何らかのメッセージが検索結果に表示されていると思われるためユーザーからクリックされにくくなる可能性がある。
そのため対応されることをお勧めする。
何らかのファイルが設置されており、そのファイルが一般的なファイルではなかったため、そのファイルについて警告している形。
アップロードしているファイルの中にそういったものがないか確認する。

まとめ

注目の質問「しごと検索のアルゴリズム」についてですが、やはり、今言えることはない、とのことでした。
Googleの人がアルゴリズムの内容を公開することはないので仕方ないですね。
期待していた方、申し訳ありません。