XMLサイトマップとは?
XMLサイトマップとは、ウェブサイト内の各ページのURLや優先度、最終更新日、更新頻度などを記述したXML形式のファイルです。検索エンジンはXMLサイトマップに記述されているURLを参考にウェブサイトをクロールします。通常はsitemap.xmlというファイルをウェブサイトのトップディレクトリにアップロードします。
サイトマップとは?
サイトマップとは、サイト内の全てのページへのリンクを訪問者向けに掲載したページです。現在では検索エンジン・訪問者のどちらに対しても必須ではなく、そもそもそのようなページを見に来る訪問者は、ウェブサイト内で迷子になっている可能性が高い為、ナビゲーションのユーザビリティを改善した方が良いと言われています。検索エンジンにとってはサイトマップページを作成する意味はなく、その代わりにXMLサイトマップを作成します。
XMLサイトマップにはどのような効果がある?
- 検索エンジンのクローラーはリンクを辿ってサイトを巡回しますが、XMLサイトマップがあればそれも参考にしてサイト内のページを巡回します。
- XMLサイトマップ内のURLはGoogleが正規URLを判断する際のヒントになります。
XMLサイトマップはウェブサイトの状態を検索エンジンに知らせる重要な役割を持ち、以下のケースでは有用です。
- 公開したてのウェブサイト
- 規模の大きなウェブサイト
- 複雑なリンク階層構造を持つウェブサイト
- 常時SSLサイト移行
- モバイル対応サイトでPC向けとスマホ向けのURLが異なる場合
XMLサイトマップの意味と必要性
HTMLのサイトマップとXMLサイトマップの違い
ウェブサイト上のHTML形式のサイトマップページは主に訪問者にウェブサイトの全体像を理解してもらい適切に誘導する為に使用しますが、
XMLサイトマップは検索エンジンのロボット向けに記述します。
HTMLサイトマップは既に必要ない?
GoogleのJohn Muller氏の発言によると、HTMLサイトマップはSEOに関しては以下の理由でほぼ意味がないようです。
小規模サイトの場合
どのみちクロール可能なサイトにする必要があり、一般的なCMSを利用していれば問題となる事はほとんどありません。
大規模サイトの場合
この場合でも、HTMLサイトマップは便利だとは言えません。XMLサイトマップやサイト内のリンクを使用して、クローラーが巡回できるかチェックすれば良いだけです。
また、HTMLサイトマップが訪問者にとって便利かと言うとそうでもなく、HTMLサイトマップページに訪問者が辿り着くという事は、サイト上のナビゲーションやサイト内検索が使いにくいという事を示しています。
彼の発言からはHTMLサイトマップの重要性は年々薄れていることがわかります。わかりやすいナビゲーション構造の方が重要です。HTMLサイトマップが必要と感じるのであれば、サイトの構造を改善した方が良いとも発言しています。
I changed my mind on HTML sitemaps over the years, they should never be needed. Sites small & large should always have a clear navigational structure. If you feel the need for a HTML sitemap, spend the time improving your site’s architecture instead. HTML sitemaps fit into the same bin with HTML loading spinners.
John Mueller氏の発言
検索エンジンクローラーの巡回経路
- 外部ページからのリンクを辿ってくる
- 検索エンジンに巡回をリクエストする
- XMLサイトマップをアップロードしてSearch Consoleに登録する
あなたのページが検索エンジンに巡回される為の道筋は3種類あります。
検索エンジンは上記の方法以外ではあなたのウェブサイトを見つける事ができません。
※URL発見にChromeブラウザを使用しているという噂もありますが、Googleは否定していています。
Stone Temple Consultingの実験でもGoogleはURL発見にChromeのデータを使用していないことが明らかになっています。
外部からのリンクを辿ってくる方法の場合は、リンクが張られ検索エンジンがそのリンクを発見して巡回してくるまでに時間がかかります。検索エンジンに巡回をリクエストするという方法は必ずしもすぐに巡回されるわけではありません。
一方でXMLサイトマップを定期更新し、Search Consoleに登録しておけば、検索エンジンはXMLサイトマップに記述されているウェブサイトの情報を把握し、巡回しにきます。
XMLサイトマップを作成するという事は、他の2つの方法よりも巡回をコントロールする事ができ、検索エンジンにとっても効率的に巡回できるメリットがあります。
ウェブサイト内のページの増減や、ページの内容が更新される度にXMLサイトマップを更新して検索エンジンに通知する事で、巡回ロボットであるクローラーにページの存在を正しく認識させる事ができます。
SEOにおけるXMLサイトマップの利点・効果とは?
XMLサイトマップ自体は検索順位には直接影響しませんが、正しいXMLサイトマップを作成する事でインデックスの処理時間が短縮されるという効果があります。
コンテンツ作成後や既存コンテンツの更新後に素早く検索結果に掲載される為にはXMLサイトマップも更新しましょう。
※Mozの記事で実際に検証した記事を見つけました。
The experiment was to see if submitting a Sitemap to Google and Yahoo would decrease the time it took Google to crawl and index the page. The results for this blog were amazing! When a Sitemap was submitted the average time it took for the bot to visit the new post was 14 minutes for Google and 245 minutes for Yahoo. When no Sitemap was submitted and the bot had to crawl to the post, it took 1375 minutes for Google and 1773 for Yahoo. The averages were calculated on 12 different posts, 6 with Sitemaps being submitted, and 6 with the Sitemaps not being submitted.
XMLサイトマップの効果
XMLサイトマップの通知が無い場合ではGoogleがクロールしてくるまでに1375分かかっていたが、XMLサイトマップを作成してGoogleに通知した場合には14分まで短縮されたようです。
XMLサイトマップが役立つウェブサイト
GoogleのSearch Consoleのヘルプ「サイトマップについて」に記述があるように、次のような場合に役立ちます。
ウェブサイトの規模が大きい
ページ数が膨大にあるようなウェブサイトの場合は、新しいコンテンツを作成してもクローラーが巡回しきれない場合があります。このような場合は、XMLサイトマップを参考にしつつクロールします。
尚、ページ数が膨大なウェブサイトの場合で、重要なページがなかなか更新されなかったり、新しいページがなかなかインデックスされない場合には、優先度の高いページをリスト化した部分的なサイトマップを作成するという方法も有効なようです。
Gary Illyes氏の発言によると、部分的なサイトマップに含まれるURLは、他より素早く頻繁にクロールするようになるそうです。
サイト内でリンクされていないページがある
検索エンジンはリンクを辿ってクロールしますので、どこからもリンクされていないページがあればインデックスされる事はありません。
XMLサイトマップのリストにそのURLが記述されていれば、クロールの対象となります。
新しいウェブサイト
ウェブサイトを立ち上げた際には、一度このXMLサイトマップを登録しておきましょう。基本的にはその後放置していても、検索エンジンがリンクを辿って各ページを登録していきます。
ページ数が多くなると検索エンジンがクロールする際の優先順位が難しくなり、追加したページがインデックスされにくくなりますので、その際は再びこのXMLサイトマップを活用していくと良いでしょう。
頻繁に記事を追加・更新するウェブサイト
インデックスが遅れれば遅れる程、ランキングの変化要因を推定する事が難しくなっていきます。
タイトルの変更や、コンテンツの質の改善などを行った場合には、同じタイミングでXMLサイトマップも更新しておくと素早く検索エンジンに通知する事ができます。
XMLサイトマップの役割と検索エンジンの動き
ここでは、XMLサイトマップの役割とどのように検索エンジンに認識されてクロール処理されるかについて解説します。
XMLサイトマップが無い場合
検索エンジンから見ると、XMLサイトマップ無しのウェブサイトはこのように見えているかもしれません。リンクで辿れるページのみインデックスされている場合もあります。大規模なサイトで深いリンク階層、ディレクトリ階層のページを更新した際にも検索エンジンのクローラーが到達できずになかなかインデックスされないようなケースも考えられます。
XMLサイトマップを設置すると?
XMLサイトマップ有りのウェブサイトならリンクで辿れるページはもちろん、深い階層に位置するページでもクローラーにページの存在、重要度、更新情報を示す事ができます。
XMLサイトマップは画像や動画の情報も含める事ができる
画像や動画を多く使用しているウェブサイトの場合は、サイトマップ内に画像や動画の情報も含めると、一般の検索以外にも、画像検索、動画検索結果に表示されやすくなります。
※2012年の情報ではGoogleはBMPやGIF、JPEG、PNG、WebP、SVGはインデックスできるようです。
動画は、文字、画像以上に表現できますが、検索エンジンには動画の内容がわかりません。
検索エンジンに認識してもらうには、動画サイトマップに情報を含めておきましょう。
Googleは、動画コンテンツの取得に力を入れていて、Search Console上で動画サイトマップを登録する事ができます。
詳しくは、「動画サイトマップの作成」をご覧ください。
動画サイトマップは、動画に関する情報をsitemap.xmlに含めてSearch Console上で登録します。
ページ情報や画像情報と同様に既存のXMLサイトマップに動画情報を含める方法と、動画専用のXMLサイトマップを作成する方法があります。
どちらでも効果に違いは無さそうですので管理しやすい方法を選択しましょう。
XMLサイトマップの作り方
XMLサイトマップは、WordPress5.5以上であれば標準でサポートされています。その他CMSを使用している場合にはプラグインを使用すると便利です。対応するプラグインが無い場合には、システム側で動的に作成する機能を開発するか、オンラインの無料ツールや市販のソフトウェアを活用すると良いでしょう。
WordPressの場合
WordPress 5.5からXMLサイトマップの生成を標準でサポートしています。WordPress 6.5からは、lastmodも標準で記述されており、GoogleやBing等の検索エンジンも推奨しています。
プラグインが利用できない場合
プラグインが利用できない場合には、独自にXMLサイトマップを生成する機能を開発するか、sitemap.xml Editorなどのオンライン無料ツールやSitemap Creatorなどの市販ツールを導入すると良いでしょう。
sitemap.xml Editorの概要
- lastmodの自動取得に対応しています。
- 1000URLまでに対応しています。
規模が大きくなると市販のソフトウェアが便利かもしれません。
Sitemap Creatorの概要
- テストでは100万ページを超えるサイトでも問題なく動作します。
- ページ数は無制限です。
- 自動でサイトマップを生成・更新するスケジューラーも利用可能です。
- 特定のカテゴリをサイトマップから除外したり、細かいカスタマイズが可能です。
XMLサイトマップのフォーマットや書式
ここでは、XMLサイトマップの記述例やルールについてまとめます。
XMLサイトマップのフォーマット例
ファイル名はsitemap.xmlでなくても問題無いようです。
しかし、一度ファイル名を確定させた後は、URL、ファイル名ともに変えない方が良いでしょう。
頻繁にファイル名やサイトマップのURLを変更した場合、Googleに余分な負荷をかけてしまい、本来見つけて欲しいページの発見が遅れるかもしれません。
複数ファイルのサイトマップをセクションごとに運用している場合などは、新しいセクションとともに対応する新しいサイトマップを追加することはあります。ただしこの場合でも既存のサイトマップのファイル名やURLは変更しない方が良いでしょう。
XMLサイトマップ書き方 書式と記述内容
最終更新日を示す <lastmod> の記述はGoogleやBingでは参考に使用されます。Bingでは特に重要視されているようです。
sitemaps.orgの定義では、XMLサイトマップでは以下のような記述ルールとなります。
- <?xml version=’1.0′ encoding=’UTF-8′?>
xml versionと文字コードUTF8を指定します。 - <urlset>
必須項目です。ファイルの他のタグを囲み、現在のプロトコル標準を参照します。
(例 : <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> - <url>
必須項目です。各URLエントリの親タグで、loc、lastmod、changefreq、priorityをこのタグ内にセットします。 - <loc>
必須項目です。ページのURLを記述します(上限値2,048 文字)。
ウェブ サーバーによっては、http/httpsなどのプロトコルから始めた絶対パスで記述し、末尾にスラッシュを含める必要があります。 - <lastmod>
任意の項目ですが、ここは正確に最終更新日の記述を行うとクロールの優先度が高くなります。この日付は W3C Datetime形式で記述します。必要な場合は、時刻の部分を省略して YYYY-MM-DD の形式で記述することもできます。
ページに重要な要素の更新を加えた際にこの日付を変更しましょう。例えば、メインコンテンツや構造化データ、ページ上のリンクは重要な要素とみなされます。一方でコピーライトなどは重要な要素ではありません。軽いデザインやテキストの変更程度であれば日付を更新する必要はありません。 - <changefreq>
任意の項目です。更新頻度ですが、情報が不正確な場合はクローラーは無視するようです。正確に記述してあってもあくまで参考値として活用されます。- always
アクセスするたびに変わるページ - hourly
1時間更新 - daily
毎日更新 - weekly
毎週更新 - monthly
毎月更新 - yearly
毎年更新 - never
更新しない
- always
- <priority>
任意の項目です。優先度は順位には影響しませんが、クローラーに重要なページを知らせる事ができます。
Googleに限って言えば、Priorityの値は完全に無視するようです。
we ignore those. It’s essentially a bag of noise
— Gary 鯨理/경리 Illyes (@methode) March 28, 2017
以上のタグを使用して記述していくと、次のような記述となります。
XMLサイトマップのタグ記述例(サンプル)
<?xml version='1.0' encoding='UTF-8'?>
<!-- generator="Inspyder Sitemap Creator" -->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com</loc>
<lastmod>2007-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.6</priority>
</url>
</urlset>
動画サイトマップの書き方
Google developersにガイドラインが掲載されています。(テキストブラウザ云々は既に古い情報なので省きました。)
- 動画を埋め込んだページのURL、再生プレイヤーのURL(SWF ファイルなど再生プレーヤーの URL)、動画ファイルそのもの(FLV ファイルなど動画ファイルの URL)のいずれかを指定。Googleが上記のURLで動画コンテンツを見つけられなければこれらのエントリは無視されます。
- 各URLエントリには、以下の情報が必須です。
- Title
- Description
- 再生ページURL
- サムネイルURL
- 動画ファイルそのものURL、または再生プレイヤーのURL
- 各サイトマップファイルは50,000動画までで、それ以上の動画コンテンツがある場合は、サイトマップファイルを分割して、サイトマップインデックスファイルを作り送信します。オプションタグを追加した場合は、ファイルサイズの制限も確認する必要があります。(圧縮しない状態で50MBまで)
- Googleがクロールできる動画ファイル
.mpg, .mpeg, .mp4, .m4v, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv, .swf.
全てのファイルはHTTPでアクセスできる状態にします。
メタファイルを使用したストリーミングプロトコル経由の再生はサポートされていないようです。 - サイトマップで指定したファイルをrobots.txtでブロックしていないか確認します。
(ページURL、動画URL、サムネイルURLなど)
動画サイトマップの内容
動画コンテンツを含むページのURLなどサイトマップに含めるべき必須タグがいくつかあります。
2022年5月に一部のタグのサポートが終了しています。
タグ | 必須項目 | 内容 |
---|---|---|
<loc> | 必須 | 動画コンテンツを含むページのURL 動画検索でランクインした際に表示され、クリックした検索ユーザーをここで指定したページに誘導します。ランディングページに複数の動画コンテンツを含む場合は、一つの< loc> 内に動画コンテンツごとに<video:video> 要素を含めます。(動画コンテンツごとに<loc> タグを使用しないようにしましょう。) |
<video:video> | 必須 | 動画に関する情報をこのタグでくくります。 |
<video:thumbnail_loc> | 必須 | 動画サムネイル画像のURLを記述。 最小:160×90 px 最大:1920×1080 px .jpg, .png, or. gifフォーマット推奨 |
<video:title> | 必須 | 動画のタイトル。 最大100文字(試していませんがもしかするとダブルバイトだと半分の文字数かもしれません。) |
<video:description> | 必須 | 動画の説明。最大2048文字(こちらもダブルバイトなら半分かもしれません。) |
<video:content_loc> | 状況に応じて | 少なくとも<video:player_loc> か、<video:content_loc> のどちらかを指定します。動画ファイルそのもののURLを指定。.mpg, .mpeg,.mp4, .m4v, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv等のフォーマットファイルを指定する事で、Googleが動画サムネイルと動画のプレビューを生成し、動画の確認の手助けにもなります。 |
<video:player_loc> | 状況に応じて | 少なくとも<video:player_loc> か、<video:content_loc> のどちらかを指定します。特定の動画の再生プレイヤーのURLを指定。通常は <embed> のsrc 要素の情報。<loc> タグの情報と同じではありません。 |
<video:duration> | 任意 | 動画の長さ(秒) 0~28800(8時間)まで指定可能 |
<video:expiration_date> | 任意 | 動画の利用期限の日付け W3C format 「YYYY-MM-DD」か、「YYYY-MM-DDThh:mm:ss+TZD」形式 期限がなければこの情報は含めない |
<video:rating> | 任意 | 動画のレイティング 小数点で0.0~5.0まで |
<video:view_count> | 任意 | ビュー数(閲覧数) |
<video:publication_date> | 任意 | 最初の公開日 W3C format YYYY-MM-DD または、YYYY-MM-DDThh:mm:ss+TZD 形式 |
同一のコンテンツを複数に言語別のURLで公開している場合
XMLサイトマップ上でrel=”alternate” hreflang=”x” 属性を指定すると、Googleは検索するユーザーに適した言語や地域の URL を検索結果ページに表示します。John Mueller氏のTwitterコメントによると、herflangでは複数の言語を指定でき、数において上限は無いようです。
No limit. For a large amount of hreflang entries, you probably want to use a sitemap though. pic.twitter.com/H0qo38GPIH
— 🍌 John 🍌 (@JohnMu) October 4, 2017
詳しい設定方法は、「サイトマップを使用して代替言語ページを指定する」で確認しましょう。
XMLサイトマップ作成時に注意すべき点
Search Consoleで「取得できませんでした」エラー
Search Consoleのサイトマップでエラー表示がされる場合があります。「取得できませんでした」または「Couldn’t fetch」と表示されます。
2024年の2月時点で以下の点がバグの可能性があるとして疑われていて、サイトマップのファイル名に関して、ハイフンの後に1桁以上の数値が表記されると本現象が再現されるようです。つまり「sitemap-1.xml」はハイフンの後の数値が1桁なので問題なく、「sitemap-9.xml」までは全く問題ありません。
一方で「sitemap-10.xml」はエラーが表示されます。sitemap10.xmlの場合はハイフンがないのでエラーが表示されません。
サイトマップファイルの文字エンコード
文字 | エスケープ コード | |
---|---|---|
アンパサンド | & | & |
一重引用符 | ‘ | ' |
二重引用符 | “ | " |
不等記号(より大) | > | > |
不等記号(より小) | < | < |
UTF-8で作成する必要があります。
サイトマップに使用できるのは ASCII 文字のみ。URLなどのデータ値では、次の文字にエンティティのエスケープコードを使用しなければならない。
XMLサイトマップのURLはwwwあり、なしを統一する
まだURLの正規化をされていない場合は、評価が分散しないようにURLの正規化を先に行っておきましょう。
モバイル対応サイトでPC向けとスマホ向けのURLが異なる場合
この場合HTMLではPC用ページに「link rel=”alternate”」でモバイル用ページを指定し、モバイル用ページには「link rel=”canonical”」でPC用ページを指定します。
※レスポンシブデザインの場合は不要です。
サイトマップには「rel=”alternate”」でモバイルページのURLを指定した記述を追記します。
詳しくはGoogleの解説ページをご参照ください。
例えばPCページが「http://www.example.com」で、それに対応するモバイルページが「http://m.example.com」なら以下のように記述していきます。
<url>
<loc>http://www.example.com</loc>
<xhtml:link
rel="alternate"
media="only screen and (max-width: 640px)"
href="http://m.example.com" />
</url>
良くある誤った指定のケースでは、PC向け各ページ全てがalternateでスマホページのトップぺージを指定しているケースです。
逆にスマホ対応の全ページのcanonicalがPC向けのトップページを指定してしまっているケースも見かけます。
どちらも必ず対応するページのURLを指定します。
サイトマップ作成ツールのSitemap Creatorでは、モバイル、PC双方の記述が正しければ自動的に検知してXMLサイトマップを記述します。
URLは50,000件までの制限、50 MBのサイズ容量の制限
50,000URLを超える場合(子要素はサイトマップに含めることができるURL制限には含まれません)や、圧縮しない状態で50 MBを超えるファイルサイズの場合は、XMLサイトマップを分割し、複数のサイトマップを束ねるサイトマップインデックスファイルを作成する必要があります。
サイトマップファイルはgzip 形式で圧縮する事でサーバー負荷をいくらか軽減できるようです。
※image:locはURLの制限件数には含まれませんが、50MBのファイルサイズの制限には含まれるようです。
※もともとは10 MBの制限でした。2016/11/30にGoogle、Bingともにサイトマップのファイルサイズは圧縮しない状態で50 MBまでに増えたとアナウンスされています。
We’ve updated the Sitemaps protocol with Bing! Sitemaps & indexes can be considerably larger now. More at https://t.co/uygpuywUEh
— Google Search Central (@googlesearchc) November 30, 2016
サイトマップインデックスファイルの書き方
- <sitemapindex>タグから始め、</sitemapindex>タグで閉じる
- 各サイトマップに<sitemap>をXML親タグとして含める
- <sitemap>に子エントリとして<loc>を含める
- 最終更新日の<lastmod>はオプションで利用可
サイトマップインデックスファイル例
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml</loc>
<lastmod>2015-12-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml</loc>
<lastmod>2015-11-21</lastmod>
</sitemap>
</sitemapindex>
※XMLサイトマップ作成ソフトのSitemap Creatorはサイトマップの分割とインデックスファイルの作成、gzip圧縮にも対応しています。
※さすがに上記のようなルールや各値を確認して毎回手作業で編集するわけにもいきませんので、プラグインやツールで自動化する方法がおすすめです。
XMLサイトマップで良くある誤った認識
- 優先度設定は検索順位の上位表示と関連があるか?
- サイトマップ内に含めるURLの順序はGoogleに影響するか?
- CSSやJavaScriptも含めるべきか?
- XMLサイトマップに含めるべきページを含めていなかった場合
- XMLサイトマップから特定のページを削除した場合
- ROR(ror.xml)サイトマップは必要?
- Google Newsサイトマップは必要?
- 画像・動画サイトマップはページURLを含めずに作成できるか?
- 重複するコンテンツのURLをサイトマップに含めた場合順位影響するか?
XMLサイトマップは、イメージ・ビデオサイトマップ拡張や、優先度、更新頻度、最終更新日等の情報を含める事ができます。
これらの情報にはそれぞれ意味がありますが、誤解も広まっているようです。
優先度設定は検索順位の上位表示と関連があるか?
優先度を高く設定すると、検索結果の順位が自然と高くなると誤って認識される方も多いようです。
GoogleではこのPriorityの値を無視しますので、実質設定する意味はほとんどないかもしれません。
サイトマップ内に含めるURLの順序はGoogleに影響するか?
順序は全く問題とはならないようです。ウェブサイトのページが全て重要であれば、全てのURLを含めておきましょう。
Save the start of the file for the most awesome URLs — the order among them doesn’t matter. Ideally, that covers your whole site already, so you’re all set!
— 🍌 John 🍌 (@JohnMu) June 13, 2018
CSSやJavaScriptも含めるべきか?
CSSやJavaScriptをサイトマップに含めてもインデックスはされないようです。
Googleがインデックスしないファイルをサイトマップに追加しても、クロールスピードを低下させる以外に何も起こりません。
GoogleはそれらのURLにアクセスするかもしれませんが、ファイル自体はインデックスできないと判断するでしょう。
Googleの手間を省き、重要なファイルのみをサイトマップに含めましょう。
イメージ(画像)やビデオ(動画)コンテンツは拡張部分として追記できます。
Googleは、イメージ、ビデオサイトマップ拡張を発表し、サイトマップにこれらを意図的に含める事ができます。
ただし注意点としては、検索エンジン利用者が実際に探されるようなコンテンツのみを含めましょう。ナビゲーションやデザイン画像(背景やボタン)等は含めないようにし、適切で正確なメタデータ(title、description)を含めます。
XMLサイトマップに含めるべきページを含めていなかった場合
XMLサイトマップはGoogleにあなたのウェブサイトの内容を知らせるロードマップのようなものです。
XMLサイトマップにウェブサイト内のいくつかのページが含まれていなかった場合でも、何回かクロールされるうちに途中でリンクを辿って漏れのあったページを辿る事はできます。
特定のURLのインデックスを拒否したい場合はnoindexメタタグを使用します。
XMLサイトマップから特定のページを削除した場合
一度XMLサイトマップに含めているページを、数ヶ月後に不要になった為、XMLサイトマップからURLを削除した場合でも、GoogleはそのXMLサイトマップを見てそのページをインデックスから削除する事はありません。404のレスポンスコードを返していれば、次回クロール時にGoogleが判断して、しばらくしてインデックスから削除する事はあります。
ROR(ror.xml)サイトマップは必要?
RORは”Resource of Resources”を意味し、必須のサイトマップ形式とされていましたが、知る限りではROR形式を使用している検索エンジンはありません。
Google Newsサイトマップは必要?
Google News Sitemapフォーマットは、Google News上に含まれるウェブサイトに対してのみ有効です。
ブログや企業サイトの場合には適切ではありません。
詳しくは以下のGoogleウェブサイトをご確認ください。
イメージ・ビデオサイトマップはページURLを含めずに作成できるか?
ページURLを含めずにXMLサイトマップを作成する方法はありません。
イメージ・ビデオサイトマップ拡張は、通常のフォーマットに情報を追加する形式となります。つまりページ情報の下に追記されます。
Googleは、あなたのウェブサイト上のページに特定の画像、動画ファイルが含まれているかどうかを知る必要があり、そうする事で検索ユーザーが動画、画像を探している際に検索ユーザーをどこへ誘導するかがわかります。
重複するコンテンツのURLをサイトマップに含めた場合順位影響するか?
John Muller氏のTwitter発言によれば、サイトマップに重複するコンテンツのURLが含まれていることが、検索順位に影響してしまうことはないようです。ランキングとクロールは別のプロセスなので、当然と言えるかもしれません。
XMLサイトマップのアップロード場所と登録手続き
Google独自のルールもありますが、基本的にはsitemaps.orgのルールを守ると良いでしょう。最終的にはSearch Consoleでエラーが無い事を確認しましょう。
XMLサイトマップのアップロード場所
sitemaps.orgではXMLサイトマップのアップロード場所をトップディレクトリ(第1階層)とし、ドメインと同一のURLリストである必要があるようです。
Googleでは、クロスサブミッションが行える為、Search Consoleが認識できれば位置はどこでも良いようです。
別ドメインのサイトマップファイルなど複数のサイトマップファイルを1つの場所で管理する事もできます。
Google、Yahoo!、Bing検索エンジン登録
Yahoo!JapanではGoogleの検索エンジンを採用している為、GoogleのSearch Consoleに登録されていれば特に何もする必要はありません。
GoogleのSearch Consoleに登録
sitemap.xmlを作成して、サーバー上にアップロードしたら、検索エンジンにsitemap.xmlをクロールしてもらうために管理ツールに登録する必要があります。(各ツールを使用するにはID登録が必要です。)
Bing Webmaster Centerに登録
Bing Search:「Bing Webmaster Center」
Bingの場合はWebmaster Centerに登録する方法の他に、クロールせずにインデックスリクエストを行えるIndexNowという仕組みもサポートするようになっています。
2022年の8月の時点でMicrosoft Bingのウェブ検索結果でクリックされた全ての新規URLのうち7%がIndexNow経由のインデックスのようです。1600万件のウェブサイトで使用され、12億件のURLが公開されています。2022年2月は8万件のウェブサイト、3月にはさらに20万件が使用しており、WordPressなどのプラグインを通して爆発的に使用が増加しているようです。
Googleはテスト中とコメントしているのみで特に動きはありません。
XMLサイトマップとRSSフィードはセットで考える
Search Consoleでのサイトマップの登録は、XMLサイトマップの他にRSSフィードも登録しておく事をおすすめします。
※CMSをご利用の場合はRSS/Atomフィードの機能が付属していと思いますので、ご確認ください。
XMLサイトマップはウェブサイト全体の巡回効率を上げ、RSSフィードはコンテンツの新規追加や、既存のコンテンツの大きなメンテナンス等の最新の情報を検索エンジンに伝えて素早くインデックスさせる事に役立ちます。