フォーマットを崩さずにPDFや文書を翻訳する方法

元のフォーマットを維持したままPDFファイルや文書を翻訳する方法。AIツール、デスクトップアプリ、オンラインサービスの比較。

Linguinチーム
Green cactus plant on white table
Photo by Mediamodifier on Unsplash

PDFの翻訳は、やってみるまでは簡単に思えます。テキストを翻訳アプリに貼り付けると、すべてのフォーマットが失われます。オンライン変換ツールを使うと、表が崩れて出力されます。デスクトップツールで処理すると、見出しが本文になってしまいます。手作業で文書を組み立て直す頃には、翻訳そのものよりも整理整頓に多くの時間を費やしてしまうことでしょう。

問題は翻訳の品質ではありません——AI翻訳は本当に良くなっています。問題は、ほとんどのツールが文書の構造を考慮して設計されていないことです。このガイドでは、実際に機能する方法、各方法にかかる時間とコスト、そして文書の種類に応じた適切なアプローチの選び方を解説します。

PDF翻訳でフォーマットが崩れる理由

PDFはプレゼンテーション形式です。構造化されたデータとしてコンテンツを保存するWord文書やHTMLとは異なり、PDFは配置されたグラフィック要素としてコンテンツを保存します。見出しは見出しとしてマークされていません——それは特定の座標に特定のフォントサイズで配置されたテキストのブロックです。表はセルのグリッドではありません——それはたまたま表のように見える一連の線とテキストボックスです。

つまり、PDFを翻訳するには、どのツールもまずレイアウト構造を解釈し——何が見出しで、何が本文で、何が表で、どの列に何が属しているかを把握してから——コンテンツを翻訳し、文書を再構築する必要があります。このレイアウト解釈の段階で、ほとんどのツールは失敗します。

これをうまく処理するツールは、スキャン文書用のOCR、レイアウト分析、翻訳、文書再構築を単一のパイプラインで組み合わせています。これは純粋な翻訳よりも技術的に難しい問題であり、そのため、うまく解決されるまでに時間がかかっているのです。

方法1: AI搭載デスクトップ翻訳ツール(最良の結果)

ほとんどのビジネス文書では、ネイティブで文書サポートを行う専用のAI翻訳ツールが最適な選択肢です。LinguinのMacアプリは、中間ステップを必要とせずに、PDF翻訳を最初から最後まで処理します。

LinguinでPDFを翻訳する方法:

  1. メニューバーからLinguin Macアプリを開きます
  2. PDFを翻訳ウィンドウにドラッグ&ドロップするか、ファイル > 開く を使用します
  3. Linguinが自動的に原文の言語を検出します
  4. ピッカーから翻訳先の言語を選択します
  5. 「文書を翻訳」をクリックします

Linguinは文書を処理し、元のレイアウトを反映した翻訳版を生成します。表は構造を保持し、見出しは階層を維持し、段組みレイアウトは尊重され、太字や斜体のフォーマットも保持されます。出力は並べて表示されるので、エクスポートする前に原文と翻訳文を比較できます。

ほとんどのビジネス文書、レポート、研究論文、技術マニュアルでは、結果はすぐに使用できます。通常とは異なるレイアウトの複雑な文書は微調整が必要な場合がありますが、バラバラの出力ではなく、よく構造化された下書きから始めることができます。

方法2: オンラインPDF翻訳サービス

複雑なレイアウトを含まない文書に対して、ある程度の品質でPDF翻訳を処理するウェブベースのサービスがいくつかあります:

Google Translate は、ウェブインターフェースを通じてPDFのアップロードを受け付け、翻訳された文書を返します。品質は近年大幅に向上しましたが、フォーマットの保持は一貫していません。シンプルな一段組の文書はきれいに戻ってきますが、表、段組み、または視覚的構造が複雑なものはレイアウトが失われる傾向があります。

DeepL は有料プランで文書翻訳を提供しています。翻訳そのものの品質は特にヨーロッパ言語で優れており、フォーマットの保持もGoogleのツールよりも優れています。制限としては、基本プランではWord、PowerPoint、プレーンテキストのアップロードのみをサポートしており、PDFサポートには上位のプランが必要です。

Adobe Acrobat には、新しいバージョンでMicrosoft Azureを利用した翻訳機能が含まれています。すでにAcrobatを購入している場合は試す価値がありますが、翻訳品質はAIファーストのツールよりもMicrosoft Translatorに近いです。

オンラインサービスは、ソフトウェアをインストールしたくない場合の、たまにしかない翻訳ニーズに適しています。留意すべきプライバシー上の考慮点は、文書の内容をサードパーティのサーバーにアップロードすることであり、これは機密文書にとって重要です。

方法3: コピー&ペーストと手動での再構築

最も古いアプローチ——すべてのテキストをコピーし、翻訳ツールに貼り付け、その後、手動で新しい文書に戻す——は、今でも時には正しい答えであることがあります。文書が短く、シンプルで、フォーマットが単純な場合、手動アプローチは出力を最も細かく制御できます。

PDFからコピー&ペーストする場合、テキストの抽出順序は必ずしも視覚的な順序通りではありません。段組み文書は、PDFリーダーが左から右へ、そして上から下へと列を読み取るため、ぐちゃぐちゃな順序で貼り付けられることがあります。このような場合、列ごとに手動でコピーすると、翻訳ツールへの入力がきれいになります。

この方法は数ページを超える文書には実用的ではありませんが、一語一語を厳密に制御する必要がある1ページの文書では、依然として有効な選択肢です。

スキャンされたPDFと画像ベースの文書の扱い

スキャンされたPDFは全く異なる課題です。スキャンされた文書は、コンピューターの視点では画像であり、OCRを実行せずに抽出できるテキストはありません。

Linguinは、スキャンされたPDFを検出すると自動的にOCRを適用します。OCRの品質はスキャンの品質に大きく依存します:

  • 300 DPI以上でスキャンされた文書は翻訳がうまくいきます
  • テキストと背景のコントラストが良いページはきれいに抽出されます
  • 手書きや特殊なフォントは手動での修正が必要な場合があります
  • 低品質または破損したスキャンは、翻訳前に前処理が必要なことが多いです

スキャンされた通常のオフィス文書や学術論文については、LinguinのOCRパイプラインが人手を介さずに抽出と翻訳を処理します。歴史的文書、手書きの記録、または品質の悪いスキャンについては、ABBYY FineReaderなどの専用OCRツールを使用して抽出をクリーンアップしてから、翻訳ツールで処理する価値があります。

特定の文書要素の保持

異なる文書タイプは、異なる保持の課題を提示します:

表: PDF内の表は、データではなくレイアウト構造として解釈されます。優れた翻訳ツールは表の境界を検出し、保持します。表が壊れて戻ってくる場合、通常の原因はPDFの内部構造が表を明確に区切っていなかったことです。このような場合、表を別々にコピーしてプレーンテキストとして翻訳し、その後再挿入すると、よりきれいな結果が得られることがよくあります。

ヘッダーとフッター: ランニングヘッダー、ページ番号、フッターのコンテンツは、PDF構造内で本文テキストとは別に保存されていることがよくあります。これらは別々に翻訳されたり、全く翻訳されなかったりする可能性があります。翻訳された文書で、ヘッダーやフッターのコンテンツが欠落していたり、誤って翻訳されていないかを確認してください。

テキストを含む埋め込み画像: 画像内にテキストを含むチャート、図、スクリーンショットは、文書翻訳ツールでは翻訳されません——テキストは画像の一部であり、抽出可能なテキストではないからです。これらは手動での対応が必要です。

脚注と後注: 脚注マーカーと注の内容は、翻訳中に関連付けが失われることがあります。脚注が多い文書は、マーカーと注が正しく対応しているか確認してください。

人間の翻訳者を使うべき時

AI文書翻訳は、ほとんどのビジネスおよび情報コンテンツに対して本当に優れています。人間の翻訳が依然として正しい選択となるカテゴリーもあります:

法的拘束力のある文書——正確さが重要であり、誤訳が責任を生む可能性がある契約書、裁判書類、規制関連書類——は、少なくともプロによるレビュー、そして多くの場合は完全な人間による翻訳が必要です。

医療および医薬品文書——用語が正確でなければならず、翻訳エラーが患者のケアに影響を与える可能性があるもの。

マーケティングおよびブランドコンテンツ——文字通りの翻訳ではなく、文化的な適応が必要なもの。ドイツ語で共感を呼ぶ製品説明は、日本語で機能させるには、単語の置き換えを超えた大幅な作り直しが必要な場合があります。

文学的および創造的作品——スタイルと声が意味と同じくらい重要なもの。

その他すべて——ビジネスレポート、技術文書、学術論文、通信文、製品マニュアル、研究——については、2026年現在のAI翻訳は、直接使用できるほど正確で自然な結果を生み出します。人間の翻訳ワークフローに比べて時間の節約は大きいです。ビジネスメールの対応に特化したヒントについては、メールをプロとして翻訳する方法のガイドをご覧ください。

多言語文書を定期的に扱う場合は、ツールの状況がどのように組み合わさっているかを理解するために、2026年最高の翻訳アプリ比較もご覧ください。