競合記事の見出し(h1〜h6)を抽出してSEO構成案を作る方法|コンテンツリサーチの実務手順
【ご注意】 本記事は2026年5月時点の一般的な情報をまとめたものです。SEO評価の挙動は検索エンジン側の仕様変更で変わる可能性があります。また、競合サイトの調査を行う際は、robots.txtや利用規約を尊重し、過度なアクセスを行わないようご注意ください。
① なぜSEO記事を書く前に競合の見出し抽出をするのか
検索上位を狙うSEO記事において、本文を書き始める前にやるべき作業が「競合の見出し抽出」です。理由はシンプルで、検索上位に並んでいる記事は、Googleが「このキーワードでユーザーが知りたいこと」だと判断しているテーマの集合体だからです。
上位記事に共通して登場する見出しは、いわば「そのキーワードで満たすべき検索意図のチェックリスト」。これを自分の頭の中だけで考えて作ろうとすると、必ず抜けが出ます。とくに小規模事業者がオウンドメディアを立ち上げる初期は、業界知識はあっても「読者が何を知りたいか」の解像度が低いことが多く、自分視点だけで構成を組むと、検索意図を外した記事になりがちです。
競合の見出しを並べて見ると、次の3つが一度に把握できます。
- 網羅性チェック:上位記事に共通する必須テーマがわかる
- 評価軸の理解:Googleがそのキーワードでどんな情報構成を評価しているかの実例が見える
- 差別化の発見:他社が触れていない切り口や、薄くしか書かれていない論点が浮かび上がる
つまり競合見出しの抽出は、コピーするための作業ではなく、自社記事の独自性を出す前提条件を整える作業だと考えるとわかりやすいです。
② 見出し構造がSEOで重要な理由
見出しタグ(h1〜h6)は、見た目の装飾ではなく記事の論理構造を表現するセマンティックなタグです。Googleは記事を読むときにこの階層情報を使い、「主題は何か」「どんな大項目で構成されているか」「どこまで詳細に踏み込んでいるか」を把握します。
h1〜h6が表す階層の意味
- h1:記事全体の主題(1ページに1つが原則)
- h2:主題を構成する大項目(章にあたる)
- h3:h2の中の中項目(節にあたる)
- h4〜h6:さらに細かい小項目(実用上、深くてもh4まででまとまる記事が多い)
この階層は「主題→大項目→詳細」という思考の流れを表現するもので、論理的に正しく組まれていれば、読者にとってもクローラーにとっても理解しやすい記事になります。逆に、h2の次にいきなりh4が来たり、h2が30個あって構造化されていなかったりする記事は、「網羅性はあるが整理されていない」印象を与えやすく、読者にとっても読みづらくなります。
見出しの順序と内容がランキングに与える影響
Googleは公式に「見出しタグはランキング要因の重要なシグナル」とは明言していませんが、検索意図への合致度を判定する手がかりとして使っていることは、検索結果の傾向から繰り返し示されています。上位記事は、検索ユーザーが知りたい順番で大項目が並んでいることが多く、見出しを上から読むだけで疑問が解消されるような構造になっています。
したがって、自社記事の構成を作るときは「どんな見出しを置くか」だけでなく、「どの順番で並べるか」「どの深さまで掘るか」まで含めて、競合の構造を参考にするのが効果的です。
③ 競合の見出しを抽出する3つの方法
競合記事の見出し階層を取り出す方法は、大きく分けて3つあります。それぞれにメリット・デメリットがあるので、用途に応じて使い分けます。
| 方法 | メリット | デメリット |
|---|---|---|
| 手作業(ブラウザ開発者ツール) | 無料・追加ツール不要・正確 | 1記事ごとに開発者ツールを開いて目視で書き出すため、5記事も見るとかなり時間がかかる |
| 有料SEOツール | 見出し抽出に加え、検索順位・被リンク・トラフィック推定なども一括で取得できる | 月額数千円〜数万円。記事執筆だけが目的なら過剰投資になりやすい |
| Webの見出し抽出ツール | URLを貼るだけでh1〜h6を階層付きで一覧化。無料で使えるものが多い | JavaScriptで遅延描画する見出しは取得できないことがある |
月に数本程度の記事を書く小規模事業者であれば、無料のWeb見出し抽出ツールから始めるのが扱いやすいです。具体的には、有料系では Ahrefs / SEMrush / Ubersuggest といったSEO統合ツール、無料系ではラッコキーワード(見出し抽出を含むコンテンツ分析機能を提供)などが代表的な選択肢です。有料SEOツールは、検索順位の継続観測・被リンク分析・サイト全体の構造監査まで含めて運用する規模になったら検討すれば十分です。
④ 見出し抽出後の構成案作成フロー
見出しを抽出しただけでは記事にはなりません。抽出結果から自社の構成案に落とし込む手順は、おおむね次のようになります。
ステップ1:競合3〜5記事の見出しを横並びにする
狙うキーワードで検索して上位の3〜5記事のURLをピックアップし、それぞれの見出しを抽出します。5記事を超えると比較作業が複雑になりすぎるため、まずは3記事から始めるのがおすすめです。スプレッドシートに「記事A/記事B/記事C」の列を作り、見出しを並べて貼り付けると比較しやすくなります。
ステップ2:共通項目(必須テーマ)を特定する
3記事すべて、または5記事中4記事以上に登場する見出しは、そのキーワードにおける「必須テーマ」だと考えてよいです。たとえば「個人事業主 開業届」というキーワードなら、上位記事のほとんどに「開業届とは」「提出のメリット・デメリット」「書き方」「提出方法」が出てくるはずです。これらは自社記事でも必ずカバーする項目になります。
ステップ3:自社の差別化ポイントを足す
共通項目だけで構成すると、よくある記事の劣化版になってしまいます。自社が一次情報を持っている領域・実体験・具体的な事例・最新の制度変更など、競合が触れていないか触れ方が浅い論点を足します。ここが記事の独自性になり、検索結果でクリックされる理由にもなります。
ステップ4:自社見出し案を組み立てる
必須テーマ+差別化要素を、読者の理解しやすい順に並べて自社の見出しを作ります。順序の基本は「概要→詳細→実践→注意点→まとめ」。検索意図が「方法を知りたい」型なら手順を早めに出す、「比較したい」型なら比較表を中盤に置く、といったように検索意図のタイプによって構成のメリハリを変えます。
⑤ 避けるべき書き方
競合リサーチは便利ですが、やり方を間違えると逆効果になります。次の3つは避けてください。
- 競合の見出しを丸写しする:見出し情報自体は事実情報ですが、構成を丸ごとコピーした記事は独自性に欠け、結果的に検索評価も伸びません。同じテーマを扱うにしても、自社の切り口・順序・粒度で組み直すことが必要です。
- 見出しだけ真似て本文が薄い:上位記事と同じh2を並べただけで本文が一般論だけ、というケースが多発しています。Googleは本文の網羅性・独自性・E-E-A-T(経験・専門性・権威性・信頼性)を見ているため、構成だけ真似ても評価はされません。
- 検索意図を満たさない見出し:「キーワードを入れたいから」という理由だけで、読者が知りたくない内容の見出しを足すのもNGです。h2は読者の疑問の単位で立て、検索意図に答える順番で並べることが原則です。
⑥ 「自分の構成案を貼って比較」モードの活用
見出し抽出ツールの中には、競合の見出しだけでなく自社の構成案を入力して比較するモードを備えたものがあります。これを使うと、構成案を作った後に「上位記事が触れているのに自分の構成にない項目」が一目でわかり、抜け漏れの最終チェックができます。
使い方の一例:
- 競合3記事のURLを抽出して見出しを取得
- 自社の構成案(h2・h3)をテキストで入力
- 比較ビューで「共通する見出し」「競合のみにある見出し」「自社のみにある見出し」を確認
- 「競合のみにある見出し」の中で必須テーマだと判断したものを自社構成に追加
- 「自社のみにある見出し」が差別化要素になっているかを再確認
この一周をやるだけで、構成案の完成度がかなり上がります。
⑦ 当サイトの「見出し抽出ツール」の使い方
Toolbox Portalの「見出し抽出ツール(Heading Extractor)」は、URLを入力するだけで競合記事のh1〜h6を階層付きで取り出せるツールです。小規模事業者がSEO記事を書くときの構成案作成に絞って設計しています。
- ツールページを開き、調査したい競合記事のURLを入力(複数URLにも対応)
- 「抽出」を実行すると、h1〜h6が階層付きのツリー表示で並ぶ
- 結果はMarkdown形式または箇条書きテキストでコピー可能
- 「構成案比較モード」に切り替えて、自社の構成案を貼り付けると、共通/差分が色分け表示される
- 抜け漏れを補強して最終構成案を確定
入力されたURLや抽出結果は、APIルート経由でサーバーが一時的にページを取得して解析するだけで、データベースなどには保存していません。処理が終わればメモリ上から破棄されるため、安心してご利用いただけます。
なお、本ツールはHTMLを静的に取得して解析する仕組みのため、SPA等で見出しがJavaScriptによって遅延描画されている場合は取得できないことがあります。そのケースでは、ブラウザの開発者ツール(Elementsタブで h1, h2, h3 を検索する等)での直接抽出を併用してください。
記事執筆の前後では、OGP・メタタグ設定ガイドでSNS表示も最適化したり、媒体別の文字数ガイドでリード文・タイトル長を整えるのもおすすめです。集客の全体像を整理したい場合は、小規模事業者の集客ロードマップもあわせてご覧ください。
⑧ 競合リサーチで気をつけること
競合の見出しを抽出する作業自体は一般的なリサーチ手法ですが、Webサイトを機械的に読み込む以上、最低限のマナーがあります。
robots.txtを尊重する
robots.txt は本来、検索エンジンのクローラーなど機械的にアクセスするプログラム向けの慣行で、ブラウザでの手作業の一般閲覧を縛るものではありません。一方で、リサーチ目的であっても反復的なアクセスを大量・高速に行う場合は、サーバー負荷の観点から robots.txt の Disallow 指定を尊重し、明示的に拒否されているパス配下を機械的に巡回・公開するような使い方は避けるのが無難です。
レート制限を意識する
一度に大量のURLを連続で取得すると、相手サーバーに負荷をかけることになります。個人レベルの記事リサーチであれば数件〜十数件で済むはずなので、必要な分だけ、間隔を空けて取得するように意識してください。
著作権と倫理面
見出しに含まれる事実情報やトピック構造は、著作物としての創作性が低いと判断されるのが一般的で、リサーチ目的の利用が問題になることはまずありません。一方、本文の文章をそのままコピーして自社記事に使うのは明確な著作権侵害になります。あくまで「テーマ・構成のリサーチ」までに留めることが重要です。
⑨ 応用:自社サイトのh構造を監査する
見出し抽出ツールは、競合分析だけでなく自社サイトの構造監査にも使えます。とくに以下のような場面で役立ちます。
- 古い記事のリライト前チェック:現状のh構造を可視化し、論理的に破綻していないか確認する
- 複数記事の構造統一:シリーズ記事や同カテゴリ記事で、h2・h3の粒度が揃っているか確認する
- 外注ライターの納品物チェック:依頼した構成通りに見出しが組まれているかを目視ではなくツールで確認する
- サイト全体の情報設計レビュー:主要記事の見出しを並べて、サイトとしての情報の重複や抜けを把握する
関連して、本文の文字数や表記揺れが気になるときは文字数カウンター、ニュースやプレスリリースの形に整えたいときはPRフォーマッター、OGP画像やメタタグの最終確認にはOGPチェッカーをあわせてご利用ください。
よくある質問(FAQ)
Q. なぜ見出し構造がSEOで重要なのですか?
見出し(h1〜h6)は記事の論理構造を表現するタグで、Googleが文書を理解する手がかりの一つになります。h1は主題、h2は大項目、h3以下は詳細という階層を正しく構築することで、検索エンジンが「この記事は何について、どこまで詳しく書かれているか」を把握しやすくなります。結果として検索意図への合致度が伝わりやすくなり、評価につながります。
Q. 自社サイトの見出し構造分析にも使えますか?
はい、使えます。自社の主要記事のURLを入力して、h1〜h6の階層が論理的に正しいか、h2の数が多すぎないか、h3が抜けてh4が登場していないかなどをチェックできます。リライト前の現状把握や、複数記事の構造を統一する際の監査ツールとして有効です。
Q. 競合の見出しをそのまま真似してもよいですか?
見出しの情報そのものはアイデアや事実情報であり、そのまま真似てもSEO上のペナルティが発生するわけではありません。ただし、構成を丸写しした記事は独自性に欠け、結果としてGoogleからの評価も低くなりがちです。共通項目を参考にしつつ、自社ならではの視点・一次情報・具体例を加えて差別化することをおすすめします。
Q. 入力したURLはどう扱われますか?保存されますか?
当サイトの見出し抽出ツールは、入力されたURLをサーバー側で一時的に取得して見出しタグを解析するだけで、URLや抽出結果をデータベース等に保存することはありません。処理が終わればメモリ上から破棄されます。社外秘ページのURLを入れる場合は、念のためアクセス制限の有無も併せてご確認ください。
Q. robots.txt で拒否されているサイトはどうなりますか?
サイト運営者がクローラーのアクセスを拒否している場合、その意思を尊重するのがWeb業界の慣行です。当ツールは大量・高頻度のアクセスを行わない設計ですが、利用者側でも、明示的にアクセスを拒否しているサイトや、ログイン後にしか見られないページの解析は避けてください。
