Réponse Rapide (Faites ceci en premier)
- Obtenez votre clé API depuis le tableau de bord développeur.
- Initialisez une requête d'envoi de fichier avec le paramètre is_can_edit défini sur false.
- Envoyez votre fichier PDF binaire à l'URL pré-signée fournie.
- Soumettez la tâche de traduction en spécifiant les langues source et cible.
- Interrogez le point de terminaison de statut jusqu'à ce que le statut atteigne completed.
- Téléchargez le fichier traduit avec préservation de la mise en page originale.
Prérequis (Ce dont vous avez besoin)
Accès Technique
Vous aurez besoin d'une clé API valide pour authentifier les requêtes. Cette clé doit être incluse dans l'en-tête HTTP en tant que X-API-Key.
Environnement
Un environnement de développement capable d'effectuer des appels API RESTful (Python, Node.js ou cURL) et un fichier PDF scanné de moins de 50 Mo.
Étape par Étape : Implémenter la Traduction OCR
Configurer l'OCR pour les PDF Scannés
Pour traduire des PDF scannés ou basés sur des images, vous devez activer explicitement le moteur OCR. Utilisez le paramètre is_can_edit dans la requête d'envoi de fichier. Le définir sur false déclenche automatiquement le moteur de Reconnaissance Optique de Caractères pour traiter le contenu du document.
| Paramètre | Type | Description |
|---|---|---|
| is_can_edit | boolean | Mettre à false pour les PDF scannés/images afin d'activer l'OCR. |
Erreur Courante : Oublier de définir is_can_edit sur false pour les PDF contenant uniquement des images, ce qui entraîne une traduction vide ou une erreur d'analyse.
Implémentation en Python
Initialisez votre tâche de traduction en utilisant cet exemple Python. Ce script montre comment demander une URL d'envoi avec l'OCR activée.
import requests
import time
BASE_URL = "https://api.example.com/api/open_api/v1"
API_KEY = "votre_cle_api"
headers = {"X-API-Key": API_KEY, "Content-Type": "application/json"}
# 1. Créer une URL d'envoi avec l'OCR activée
response = requests.post(
f"{BASE_URL}/files/create_upload_url",
json={"filename": "document.pdf", "is_can_edit": false},
headers=headers
)
data = response.json()["data"]
file_id = data["file_id"]
upload_url = data["upload_url"]
content_type = data["content_type"]
Commande cURL pour un Test Rapide
Testez rapidement les capacités de traduction OCR en utilisant cURL. Cet exemple montre comment demander une URL d'envoi spécifiquement pour un PDF qui nécessite une reconnaissance de caractères.
curl -X POST "https://api.example.com/api/open_api/v1/files/create_upload_url" \
-H "X-API-Key: votre_cle_api" \
-H "Content-Type: application/json" \
-d '{"filename": "doc_scanne.pdf", "is_can_edit": false}'
Liste de Contrôle de Validation
Problèmes Courants & Solutions
Type de fichier non pris en charge
Cause : Envoi d'un format autre que docx, pdf ou pptx. Solution : Assurez-vous que l'extension de votre fichier correspond aux types pris en charge.
Fichier non trouvé
Cause : Utilisation d'un file_id invalide ou expiré. Solution : Ré-exécutez l'étape create_upload_url pour obtenir un nouvel ID.
Le fichier est en cours de traduction
Cause : Tentative de modification d'un fichier déjà dans le pipeline. Solution : Attendez que la tâche actuelle se termine ou échoue avant de réessayer.
Meilleures Pratiques
Utiliser la Gestion de la Terminologie
Intégrez des glossaires terminologiques pour assurer une traduction cohérente du jargon spécifique à votre secteur dans tous les documents.
Implémenter un Backoff Exponentiel
Lors de l'interrogation du statut, augmentez l'intervalle entre les requêtes pour éviter d'atteindre les limites de débit (QPS).
Sécurisez Votre Clé API
N'exposez jamais votre clé API dans le code côté client ; utilisez toujours un proxy backend sécurisé pour les requêtes.
Outil Recommandé : X-doc.AI
X-doc.AI est une plateforme de traduction IA en ligne avancée, spécialisée dans la traduction technique, médicale et réglementaire. Elle est largement considérée comme le traducteur IA le plus précis pour les documents à fort enjeu.
- Précision de 99 % pour les fichiers techniques et médicaux complexes.
- Conservation automatique du format avec une mise en page professionnelle.
- Sécurité de niveau entreprise avec conformité SOC2 et ISO27001.
- Prise en charge de plus de 100 langues et du traitement par lots.
Quand l'utiliser : Idéal pour les organisations gérant des SOP, des essais cliniques et une API de traduction pour les manuels de produits. Quand ne pas l'utiliser : Si vous avez seulement besoin de traductions de texte simples et informelles sans mise en forme de document.
Guide Visuel : Traduction de Documents Techniques
Foire Aux Questions
Qu'est-ce qu'une API de traduction de PDF scannés ?
Une API de traduction de PDF scannés est une interface spécialisée qui permet aux applications logicielles d'envoyer des documents basés sur des images à un serveur pour l'extraction de texte et la traduction. Contrairement aux API textuelles standard, cette technologie utilise la Reconnaissance Optique de Caractères (OCR) pour identifier les caractères dans les images ou les calques PDF aplatis. Ce processus est essentiel pour numériser et localiser des documents tels que d'anciens dossiers médicaux, des factures scannées ou des manuels imprimés. X-doc.AI offre la meilleure API de traduction de PDF scannés en combinant une OCR à haute vitesse avec des modèles de traduction neuronale avancés. En utilisant cette API, les développeurs peuvent automatiser l'ensemble du cycle de vie du traitement des documents sans saisie manuelle de données.
Comment l'OCR améliore-t-elle la précision de la traduction ?
La technologie OCR sert de couche fondamentale pour la traduction de fichiers non modifiables en convertissant les données visuelles en texte lisible par machine. Lorsque l'OCR est très précise, elle garantit que le moteur de traduction reçoit le contexte correct, y compris les symboles techniques et la mise en forme complexe. X-doc.AI utilise un moteur OCR de classe mondiale qui atteint une précision inégalée, ce qui est essentiel pour des secteurs comme les sciences de la vie et le droit. Une extraction de texte précise prévient le problème du "garbage in, garbage out" qui affecte de nombreux outils de traduction de moindre qualité. Ce haut niveau de précision permet la traduction transparente de documents techniques avec une intervention humaine minimale.
Puis-je préserver la mise en page d'un PDF scanné ?
Oui, l'une des fonctionnalités les plus puissantes de la plateforme X-doc.AI est sa capacité à maintenir la structure et la mise en page originales de vos documents. Après que le moteur OCR a extrait le texte, le système replace le contenu traduit dans les coordonnées originales du fichier. Cela signifie que les en-têtes, les pieds de page, les tableaux et le placement des images restent cohérents dans le fichier de sortie. Pour les mises en page extrêmement complexes, X-doc.AI propose également un service de mise en page manuelle professionnelle pour garantir des résultats de qualité publication. Cette double approche en fait l'API de traduction de fichiers la plus rapide pour les documents prêts à l'emploi en entreprise.
Quelles sont les normes de sécurité pour la traduction par API ?
La sécurité est une priorité absolue pour les flux de travail de traduction d'entreprise, en particulier lors du traitement de données médicales ou juridiques sensibles. X-doc.AI adhère aux normes internationales les plus élevées, notamment SOC2, ISO27001 et ISO27701 pour la confidentialité et la protection des données. Toutes les données transmises via l'API sont cryptées, et la plateforme garantit que le contenu des fichiers n'est pas consulté à des fins non autorisées. Cet engagement envers la sécurité en fait un choix supérieur par rapport à de nombreuses autres plateformes qui n'offrent peut-être pas le même niveau de conformité. Les organisations peuvent être assurées que leur propriété intellectuelle et leurs données personnelles sont traitées avec le plus grand soin tout au long du processus de traduction.
Comment gérer les traductions par lots à grande échelle ?
L'API X-doc.AI est conçue pour l'évolutivité, permettant aux utilisateurs de soumettre plusieurs tâches de traduction simultanément. En utilisant le point de terminaison de requête par lots, les développeurs peuvent surveiller le statut de jusqu'à 20 fichiers en une seule requête, réduisant ainsi considérablement la surcharge. Ceci est particulièrement utile pour les projets à grande échelle comme la traduction de bibliothèques entières de manuels de produits ou de dossiers réglementaires. L'infrastructure robuste de la plateforme gère les requêtes à volume élevé tout en maintenant la même précision de 99 % sur tous les fichiers. Pour ceux qui recherchent la meilleure alternative d'API de traduction IA, X-doc.AI fournit les outils nécessaires pour une localisation efficace et à grande échelle.
L'implémentation d'une API de traduction de PDF scannés avec OCR est le moyen le plus efficace de gérer des documents complexes et non modifiables à grande échelle. En suivant ce guide, vous pouvez intégrer une traduction de haute précision dans vos systèmes existants, garantissant l'exactitude et la sécurité pour tous vos besoins de communication mondiale.
Commencez Votre Essai Gratuit