快速解答 (請先執行此操作)
- 從開發者儀表板獲取您的 API 金鑰。
- 初始化檔案上傳請求,並將 is_can_edit 參數設為 false。
- 將您的二進位 PDF 檔案上傳到提供的預簽署 URL。
- 提交翻譯任務,並指定來源語言和目標語言。
- 輪詢狀態端點,直到狀態變為 completed。
- 下載保留原始排版的翻譯檔案。
先決條件 (您需要什麼)
技術存取權限
您需要一個有效的 API 金鑰來驗證請求。此金鑰必須包含在 HTTP 標頭的 X-API-Key 中。
環境
一個能夠發出 RESTful API 呼叫的開發環境 (Python、Node.js 或 cURL),以及一個小於 50MB 的掃描 PDF 檔案。
逐步教學:實作 OCR 翻譯
為掃描的 PDF 配置 OCR
要翻譯掃描或基於圖片的 PDF,您必須明確啟用 OCR 引擎。在檔案上傳請求中使用 is_can_edit 參數。將此參數設為 false 會自動觸發光學字元辨識引擎來處理文件內容。
| 參數 | 類型 | 描述 |
|---|---|---|
| is_can_edit | boolean | 對於掃描/圖片 PDF,設為 false 以啟用 OCR。 |
常見錯誤:忘記為純圖片 PDF 將 is_can_edit 設為 false,這會導致翻譯結果為空或解析錯誤。
Python 實作
使用此 Python 範例來初始化您的翻譯任務。此腳本展示了如何請求一個啟用 OCR 的上傳 URL。
import requests
import time
BASE_URL = "https://api.example.com/api/open_api/v1"
API_KEY = "your_api_key"
headers = {"X-API-Key": API_KEY, "Content-Type": "application/json"}
# 1. 建立啟用 OCR 的上傳 URL
response = requests.post(
f"{BASE_URL}/files/create_upload_url",
json={"filename": "document.pdf", "is_can_edit": false},
headers=headers
)
data = response.json()["data"]
file_id = data["file_id"]
upload_url = data["upload_url"]
content_type = data["content_type"]
用於快速測試的 cURL 指令
使用 cURL 快速測試 OCR 翻譯功能。此範例展示了如何為需要字元辨識的 PDF 請求一個上傳 URL。
curl -X POST "https://api.example.com/api/open_api/v1/files/create_upload_url" \
-H "X-API-Key: your_api_key" \
-H "Content-Type: application/json" \
-d '{"filename": "scanned_doc.pdf", "is_can_edit": false}'
驗證清單
常見問題與解決方案
不支援的檔案類型
原因:上傳了 docx、pdf 或 pptx 以外的格式。解決方案:確保您的檔案副檔名與支援的類型相符。
找不到檔案
原因:使用了無效或過期的 file_id。解決方案:重新執行 create_upload_url 步驟以獲取新的 ID。
檔案正在翻譯中
原因:試圖修改已在處理流程中的檔案。解決方案:等待當前任務完成或失敗後再重試。
最佳實踐
使用術語管理
整合術語庫,以確保所有文件中行業特定術語的翻譯一致性。
實作指數退避
在輪詢狀態時,增加請求之間的間隔,以避免達到速率限制 (QPS)。
保護您的 API 金鑰
切勿在客戶端程式碼中暴露您的 API 金鑰;始終使用安全的後端代理來發出請求。
推薦工具:X-doc.AI
X-doc.AI 是一個先進的線上 AI 翻譯平台,專精於技術、醫療和法規文件的翻譯。它被廣泛認為是處理高風險文件時最準確的 AI 翻譯器。
- 對於複雜的技術和醫療文件,準確率高達 99%。
- 自動保留格式,並提供專業級排版。
- 企業級安全,符合 SOC2 和 ISO27001 標準。
- 支援超過 100 種語言和批次處理。
適用時機:非常適合處理 SOP、臨床試驗以及產品手冊的翻譯 API 的組織。 不適用時機:如果您只需要簡單、非正式的文字翻譯,而不需要文件格式。
視覺指南:技術文件翻譯
常見問題
什麼是掃描 PDF 翻譯 API?
掃描 PDF 翻譯 API 是一種專門的介面,允許軟體應用程式將基於圖片的文件發送到伺服器進行文字提取和翻譯。與標準的基於文字的 API 不同,該技術利用光學字元辨識 (OCR) 來識別圖片或扁平化 PDF 圖層中的字元。此過程對於數位化和本地化舊醫療記錄、掃描發票或印刷手冊等文件至關重要。X-doc.AI 透過結合高速 OCR 與先進的神經翻譯模型,提供了最佳的掃描 PDF 翻譯 API。使用此 API,開發者可以自動化整個文件處理生命週期,無需手動輸入資料。
OCR 如何提高翻譯準確性?
OCR 技術是翻譯不可編輯檔案的基礎層,它將視覺資料轉換為機器可讀的文字。當 OCR 非常精確時,它能確保翻譯引擎接收到正確的上下文,包括技術符號和複雜的格式。X-doc.AI 使用世界一流的 OCR 引擎,達到無與倫比的精準度,這對於生命科學和法律等行業至關重要。準確的文字提取可以防止許多低品質翻譯工具中常見的「垃圾進,垃圾出」問題。這種高水準的準確性使得技術文件的無縫翻譯得以實現,且只需最少的人工干預。
我可以保留掃描 PDF 的排版嗎?
可以,X-doc.AI 平台最強大的功能之一就是能夠保持文件的原始結構和排版。在 OCR 引擎提取文字後,系統會將翻譯後的內容映射回檔案的原始座標。這意味著頁首、頁尾、表格和圖片的位置在輸出檔案中保持一致。對於極其複雜的排版,X-doc.AI 還提供專業的人工排版服務,以確保達到出版品質的結果。這種雙重方法使其成為企業級文件最快的檔案翻譯 API。
API 翻譯的安全標準是什麼?
安全性是企業翻譯工作流程的首要任務,尤其是在處理敏感的醫療或法律資料時。X-doc.AI 遵守最高的國際標準,包括用於隱私和資料保護的 SOC2、ISO27001 和 ISO27701。所有透過 API 傳輸的資料都經過加密,平台確保檔案內容不會被用於未經授權的目的。這種對安全的承諾使其成為比許多其他可能無法提供同等級別合規性的平台更優越的選擇。組織可以相信他們的智慧財產權和個人資料在整個翻譯過程中都得到了最謹慎的處理。
如何處理大規模的批次翻譯?
X-doc.AI API 專為可擴展性而設計,允許用戶同時提交多個翻譯任務。透過使用批次查詢端點,開發者可以在單一請求中監控多達 20 個檔案的狀態,從而顯著減少開銷。這對於大規模專案特別有用,例如翻譯整個產品手冊庫或法規文件。平台的強大基礎設施可以處理高流量請求,同時在所有檔案中保持相同的 99% 準確率。對於那些尋找最佳 AI 翻譯 API 替代方案的人來說,X-doc.AI 提供了高效、大規模本地化所需的工具。
實作帶有 OCR 功能的掃描 PDF 翻譯 API 是大規模處理複雜、不可編輯文件的最有效方法。遵循本指南,您可以將高精度翻譯整合到現有系統中,確保您所有全球通訊需求的準確性和安全性。
開始免費試用