PDFをExcel・Wordに変換|表データを崩さず編集可能にする手順
【免責事項】 本記事は2026年5月時点の情報に基づく一般的な解説です。PDFの作られ方やレイアウトによって変換結果は変わり、特にスキャンPDFのOCR結果には誤認識が含まれる場合があります。変換後のデータは必ず元のPDFと照合し、金額や数値の正確性をご自身でご確認ください。
① PDFをExcel・Wordに変換するときにつまずくポイント
取引先から受け取った見積書や報告書がPDFで、その表をExcelに取り込んで再計算したい——個人事業主にとってよくある場面です。ところが実際に変換すると、「表の行や列がずれる」「文字が読み取れない」といったトラブルにぶつかります。原因を理解しておくと、対処もスムーズになります。
表のズレが起きる理由
PDFはもともと「どの位置にどの文字を表示するか」という見た目の情報だけを持つフォーマットです。Excelのような「セル」「行」「列」という表の構造を持っていません。そのため変換ソフトは、文字の座標を手がかりに「ここからここまでが1つの列だろう」と推測します。この推測がうまくいかないと、本来別の列にあるべき数字が同じセルに入ってしまったり、1つのセルの文章が複数行に分割されたりします。
スキャンPDFは文字認識が必要になる
紙の書類をスキャナーやスマホで取り込んで作ったPDFは、ページ全体が1枚の画像として保存されています。人の目には文字に見えても、コンピュータにとっては「文字」ではなく「絵」です。この場合はそのまま変換できず、画像から文字を読み取るOCR(光学文字認識)という処理が必要になります。
② テキストPDFと画像PDF(スキャン)の違い
変換作業を始める前に、手元のPDFがどちらのタイプかを見分けることが重要です。タイプによって必要な手順がまったく変わります。
| テキストPDF | 画像PDF(スキャン) | |
|---|---|---|
| 作られ方 | ExcelやWordなどから書き出し | 紙をスキャン・写真撮影 |
| 文字データ | あり(選択・コピー可能) | なし(画像のみ) |
| 変換方法 | そのまま変換できる | OCRで文字認識が必要 |
| 変換の精度 | 比較的高い | 画質に左右される |
見分け方は「文字を選択できるか」
もっとも簡単な見分け方は、PDFをビューアで開いて本文の文字をマウスでドラッグしてみることです。文字が1文字ずつハイライトされて選択できればテキストPDF、文字を選択できずページ全体しか選べなければ画像PDFです。スマホで撮った書類や、コンビニのスキャナーで取り込んだ書類は、ほぼ画像PDFと考えてよいでしょう。
③ Excelに変換する手順と表崩れを防ぐコツ
テキストPDFの表をExcelに変換する基本的な流れは次のとおりです。
- 変換したいPDFファイルを用意する(文字が選択できるか事前に確認)
- PDF→Excel変換ツールにファイルを読み込ませる
- 変換されたExcelファイルをダウンロードする
- 表のレイアウトと数値を元のPDFと照合する
表崩れを防ぐ4つのコツ
- 罫線のはっきりした表ほど精度が上がる。罫線のない表は列の区切りが推測しにくいため、ズレやすくなります
- 1ページに1つの表になっているPDFのほうが安定する。複数の表が同じページに並んでいると、変換ツールが境界を誤判定しやすくなります
- 結合セルや注釈付きの表は崩れやすいと心得る。変換後に手作業での修正が前提と考えておくと安心です
- 変換後は合計値で検算する。各行の数字が正しく列に収まっていれば、Excelで合計を出したとき元PDFの合計と一致します。一致しなければどこかでズレが起きています
なお、表の体裁よりも文章の中身を残したい報告書などは、ExcelではなくWordへの変換が向いています。Wordは段落や見出しといった文書構造を保ちやすいためです。目的に応じて変換先を選びましょう。
④ スキャンされたPDFはOCRが必要
画像PDF(スキャンPDF)は、前述のとおりページが画像として保存されているため、変換ツールにそのまま入れても文字データを取り出せません。まずOCR(光学文字認識)で画像内の文字を読み取り、テキストデータに変換する必要があります。
スキャンPDFから文字を抜き出したい場合は、OCRテキスト抽出ツールを使うと、画像化された書類から文字を取り出せます。抽出したテキストを整えてからExcelやWordに貼り付ける、という二段構えの作業になります。
OCRの精度を上げるポイント
- 解像度の高い画像を使う。ぼやけた写真や低解像度のスキャンは誤認識が増えます
- 傾きや影を避ける。書類が斜めに写っていたり影がかかっていると認識精度が落ちます
- 結果は必ず目視で確認する。OCRは「0」と「O」、「1」と「l」のような似た文字を取り違えることがあります。金額や数量は特に注意して照合してください
⑤ オンライン変換ツールを使うときの注意点
PDF変換は無料のオンラインツールが多数ありますが、扱うPDFの中身によっては選び方に注意が必要です。
機密情報を含むPDFは慎重に
請求書・見積書・契約書・顧客リストなどには、取引先名や金額、個人情報といった機密情報が含まれます。一般的なオンライン変換ツールの多くは、ファイルを一度運営者のサーバーへアップロードして処理します。この方式は便利な反面、ファイルがどこに保存され、いつ削除されるかは運営者のポリシー次第です。
ブラウザ完結型のツールを選ぶ
機密性の高い書類を変換するなら、ファイルを外部サーバーに送信せず、ブラウザ内(自分の端末上)だけで処理が完結するツールを選ぶと安全性が高まります。アップロード型のツールを使わざるを得ない場合は、次の点を事前に確認してください。
- アップロードしたファイルの保存期間と自動削除のポリシーが明示されているか
- 運営者の会社名・所在地などの情報が公開されているか
- 通信が暗号化(httpsなど)されているか
⑥ 当サイトのツールでPDFをExcelに変換する手順
Toolbox PortalのPDF→Excel変換ツールは、ファイルを外部サーバーに送らずブラウザ内で処理が完結します。請求書や見積書など機密を含むPDFでも、データが手元の端末から出ていかないため安心して使えます。
- PDF→Excel変換ツールのページを開く
- 変換したいPDFファイルを選択またはドラッグ&ドロップで読み込ませる
- 表の抽出結果を確認する
- Excel形式でファイルをダウンロードする
- 元のPDFと数値・レイアウトを照合し、必要に応じて手作業で整える
なお、スキャンPDFの場合は先にOCRでテキスト化が必要な点は前述のとおりです。テキストPDFかどうかを確認してから利用してください。
PDF関連では、変換前に重いファイルを軽くしたいときのPDFのファイルサイズを小さくする方法や、PDFをZIPでまとめて送る際に起きやすいZIPファイルの文字化けを直す方法もあわせて参照してください。
⑦ よくある質問(FAQ)
Q. PDFをExcelに変換すると表が崩れるのはなぜですか?
PDFは見た目を固定するフォーマットで、セルや行・列という表構造の情報を持ちません。変換ツールは文字の座標から表のかたちを推測するため、罫線のない表や結合セルがあると行や列がずれることがあります。罫線のはっきりした表ほど精度が上がります。
Q. スキャンしたPDFはそのままExcelに変換できますか?
スキャンPDFはページ全体が画像のため、そのままでは文字データを取り出せません。OCRで画像から文字を読み取る処理を経て初めて、編集できるテキストになります。OCR結果は誤認識が起きうるため、変換後に必ず内容を確認してください。
Q. テキストPDFと画像PDFはどう見分ければよいですか?
PDFをビューアで開き、本文の文字をマウスでドラッグして選択できればテキストPDF、文字を選択できず画像全体しか選べなければ画像PDF(スキャンPDF)です。テキストPDFはそのまま変換でき、画像PDFはOCRが必要になります。
Q. オンラインのPDF変換ツールを使うときに気をつけることは?
請求書や契約書など機密情報を含むPDFは、ファイルを外部サーバーに送信するツールではなく、ブラウザ内で処理が完結するツールを選ぶと安全です。アップロード型を使う際は、保存期間・削除ポリシー・運営者情報を事前に確認しましょう。
