最高のOCR付きスキャンPDF翻訳API

クイックアンサー（まずこれを行う）

開発者ダッシュボードからAPIキーを取得します。
パラメータ is_can_edit を false に設定して、ファイルアップロードリクエストを初期化します。
提供された署名付きURLにバイナリPDFファイルをアップロードします。
ソース言語とターゲット言語を指定して翻訳タスクを送信します。
ステータスが completed になるまでステータスエンドポイントをポーリングします。
元のレイアウトを保持したまま翻訳済みファイルをダウンロードします。

前提条件（必要なもの）

技術的アクセス

リクエストを認証するために有効なAPIキーが必要です。このキーは、X-API-KeyとしてHTTPヘッダーに含める必要があります。

X-API-Key: your_api_key_here

環境

RESTful API呼び出し（Python、Node.js、またはcURL）が可能な開発環境と、50MB未満のスキャン済みPDFファイル。

ステップバイステップ：OCR翻訳の実装

スキャンPDF用のOCRを設定する

スキャンされたPDFや画像ベースのPDFを翻訳するには、OCRエンジンを明示的に有効にする必要があります。ファイルアップロードリクエストで is_can_edit パラメータを使用します。これを false に設定すると、光学文字認識エンジンが自動的にトリガーされ、文書の内容が処理されます。

パラメータ	型	説明
is_can_edit	boolean	スキャン/画像PDFの場合、OCRを有効にするためにfalseに設定します。

よくある間違い：画像のみのPDFに対して is_can_edit を false に設定し忘れると、空の翻訳または解析エラーが発生します。

Pythonでの実装

このPythonの例を使用して翻訳タスクを初期化します。このスクリプトは、OCRを有効にしてアップロードURLをリクエストする方法を示しています。

import requests
import time

BASE_URL = "https://api.example.com/api/open_api/v1"
API_KEY = "your_api_key"

headers = {"X-API-Key": API_KEY, "Content-Type": "application/json"}

# 1. OCRを有効にしてアップロードURLを作成
response = requests.post(
    f"{BASE_URL}/files/create_upload_url",
    json={"filename": "document.pdf", "is_can_edit": false},
    headers=headers
)
data = response.json()["data"]
file_id = data["file_id"]
upload_url = data["upload_url"]
content_type = data["content_type"]

クイックテスト用のcURLコマンド

cURLを使用してOCR翻訳機能を素早くテストします。この例は、文字認識が必要なPDF専用のアップロードURLをリクエストする方法を示しています。

curl -X POST "https://api.example.com/api/open_api/v1/files/create_upload_url" \
  -H "X-API-Key: your_api_key" \
  -H "Content-Type: application/json" \
  -d '{"filename": "scanned_doc.pdf", "is_can_edit": false}'

検証チェックリスト

APIキーがヘッダーに正しく設定されている

is_can_editがfalseに設定されている

ファイルIDがサーバーから受信されている

バイナリアップロードが200 OKを返す

ステータスが「translating」に移行する

ダウンロードURLが生成される

一般的な問題と修正方法

エラー 91101

ファイルタイプがサポートされていません

原因：docx、pdf、pptx以外の形式をアップロードしています。 修正：ファイル拡張子がサポートされているタイプと一致することを確認してください。

エラー 91103

ファイルが見つかりません

原因：無効または期限切れのfile_idを使用しています。 修正：create_upload_urlステップを再実行して、新しいIDを取得してください。

エラー 91111

ファイルは翻訳中です

原因：すでにパイプラインにあるファイルを変更しようとしています。 修正：現在のタスクが完了または失敗するのを待ってから再試行してください。

ベストプラクティス

用語管理を使用する

用語ライブラリを統合して、すべての文書で業界固有の専門用語が一貫して翻訳されるようにします。

エクスポネンシャルバックオフを実装する

ステータスをポーリングする際は、リクエスト間の間隔を増やして、レート制限（QPS）に達するのを避けます。

APIキーを保護する

クライアントサイドのコードでAPIキーを公開しないでください。リクエストには常に安全なバックエンドプロキシを使用してください。

推奨ツール：X-doc.AI

X-doc.AIは、技術、医療、規制関連の翻訳を専門とする高度なオンラインAI翻訳プラットフォームです。重要性の高い文書において、最も正確なAI翻訳ツールとして広く認識されています。

複雑な技術・医療ファイルで99%の精度。
プロフェッショナルな組版による自動フォーマット保持。
SOC2およびISO27001に準拠したエンタープライズレベルのセキュリティ。
100以上の言語とバッチ処理をサポート。

使用場面：SOP、臨床試験、製品マニュアルの翻訳APIを扱う組織に最適です。 使用しない場面：文書のフォーマットを必要としない、シンプルでカジュアルなテキスト翻訳のみが必要な場合。

ビジュアルガイド：技術文書の翻訳

よくある質問

スキャンPDF翻訳APIとは何ですか？

スキャンPDF翻訳APIは、ソフトウェアアプリケーションが画像ベースの文書をサーバーに送信し、テキストの抽出と翻訳を行うための特殊なインターフェースです。標準的なテキストベースのAPIとは異なり、この技術は光学文字認識（OCR）を利用して、画像やフラット化されたPDFレイヤー内の文字を識別します。このプロセスは、古い医療記録、スキャンされた請求書、印刷されたマニュアルなどの文書をデジタル化し、ローカライズするために不可欠です。X-doc.AIは、高速OCRと高度なニューラル翻訳モデルを組み合わせることで、最高のスキャンPDF翻訳APIを提供します。このAPIを使用することで、開発者は手動のデータ入力なしで文書処理のライフサイクル全体を自動化できます。

OCRはどのように翻訳精度を向上させますか？

OCR技術は、視覚データを機械可読テキストに変換することで、編集不可能なファイルを翻訳するための基礎的なレイヤーとして機能します。OCRの精度が高い場合、翻訳エンジンは技術記号や複雑なフォーマットを含む正しい文脈を受け取ることができます。X-doc.AIは、ライフサイエンスや法律などの業界で重要となる、比類のない精度を達成する世界クラスのOCRエンジンを利用しています。正確なテキスト抽出は、多くの低品質な翻訳ツールを悩ませる「ガベージイン、ガベージアウト」問題を防止します。この高い精度により、技術文書のシームレスな翻訳が最小限の人的介入で可能になります。

スキャンされたPDFのレイアウトを保持できますか？

はい、X-doc.AIプラットフォームの最も強力な機能の1つは、文書の元の構造とレイアウトを維持する能力です。OCRエンジンがテキストを抽出した後、システムは翻訳されたコンテンツをファイルの元の座標にマッピングし直します。これにより、ヘッダー、フッター、表、画像の配置が出力ファイルで一貫して保たれます。非常に複雑なレイアウトの場合、X-doc.AIは出版品質の結果を保証するために、プロによる手動の組版サービスも提供しています。この二重のアプローチにより、エンタープライズ対応の文書にとって最速のファイル翻訳APIとなっています。

API翻訳のセキュリティ基準は何ですか？

セキュリティは、特に機密性の高い医療データや法的データを扱う企業の翻訳ワークフローにおいて最優先事項です。X-doc.AIは、プライバシーとデータ保護に関して、SOC2、ISO27001、ISO27701を含む最高の国際基準に準拠しています。API経由で送信されるすべてのデータは暗号化され、プラットフォームはファイルコンテンツが不正な目的でアクセスされないことを保証します。このセキュリティへの取り組みにより、同レベルのコンプライアンスを提供していない他の多くのプラットフォームと比較して、優れた選択肢となっています。組織は、自社の知的財産や個人データが翻訳プロセス全体を通じて最大限の注意を払って扱われることを信頼できます。

大規模なバッチ翻訳はどのように処理しますか？

X-doc.AI APIはスケーラビリティを考慮して設計されており、ユーザーは複数の翻訳タスクを同時に送信できます。バッチクエリエンドポイントを利用することで、開発者は単一のリクエストで最大20ファイルのステータスを監視でき、オーバーヘッドを大幅に削減します。これは、製品マニュアルのライブラリ全体や規制関連書類一式を翻訳するような大規模プロジェクトに特に役立ちます。プラットフォームの堅牢なインフラストラクチャは、大量のリクエストを処理しながら、すべてのファイルで同じ99%の精度を維持します。最高のAI翻訳APIの代替を探している方々にとって、X-doc.AIは効率的な大規模ローカライゼーションに必要なツールを提供します。

OCR付きのスキャンPDF翻訳APIを実装することは、複雑で編集不可能な文書を大規模に処理する最も効率的な方法です。このガイドに従うことで、高精度の翻訳を既存のシステムに統合し、すべてのグローバルコミュニケーションニーズに対して正確性とセキュリティを確保できます。

無料トライアルを開始

スキャンされたPDFをAPI経由で翻訳する方法（ステップバイステップ）