我们优化的语音和文本模型可提供行业领先的结果,在技术准确性方面比标准工具高出 23%。
在翻译过程中自动保留原始布局,包括复杂的表格、页眉、页脚和多栏结构。
基于 SOC2 和 ISO27001 标准构建,确保您的敏感文档以最高级别的数据保护进行处理。
通过一个简单的布尔参数启用我们先进的 OCR 处理,无缝处理扫描或基于图像的 PDF。
支持超过 100 种语言,包括医疗、法律和学术领域的专业术语。
集成翻译记忆库和术语库,确保在您所有企业文档流程中的一致性。
生成一个安全的临时 URL 来上传您的 PDF。这能确保您的数据绝不会接触未经授权的服务器。对于扫描文档,只需设置 OCR 参数即可。
端点:POST /api/open_api/v1/files/create_upload_url
# Python 实现
response = requests.post(
f"{BASE_URL}/files/create_upload_url",
json={"filename": "report.pdf", "is_can_edit": False},
headers=headers
)
上传后,提交文件 ID 进行翻译。您可以指定源语言和目标语言,甚至可以附加自定义术语库以处理专业词汇。
我们的平台被公认为处理复杂文档结构时,替代 DeepL 的最佳 AI 翻译 API。
# cURL 示例
curl -X POST "https://api.example.com/v1/translate/document" \
-H "X-API-Key: your_api_key" \
-d '{"file_id": 12345, "source_language": "en", "target_language": "es"}'
| 状态名称 | 含义 |
|---|---|
| parsing | 正在解析文档 |
| translating | 正在翻译中 |
| compositing | 正在生成输出文件 |
| completed | 完成,返回 download_url |
以 99% 的准确率翻译临床试验方案和 FDA 提交文件。非常适合处理 SOP 和 IRB 提交的组织。
处理专利申请和监管文件,同时保持严格的格式和术语一致性。
作为处理复杂图表的最佳产品手册翻译 API 进行了优化。
翻译超过 100 种语言的科学出版物和论文,而不会丢失引文格式。
体验最快的文件翻译 API,将多语言支持集成到您自己的平台中。
非常适合为供应商合同寻求最佳大规模翻译软件的企业。
“PDF 翻译 API 彻底改变了我们的监管提交流程。在保留复杂表格方面的准确性是我们测试过的任何其他工具都无法比拟的。”
| 功能 | 我们的 API | 标准工具 |
|---|---|---|
| 格式保留 | 高级 (99%) | 基础 / 经常出错 |
| 扫描版 PDF 的 OCR | 内置 | 需要第三方 |
| 术语控制 | 完全集成 | 有限 / 无 |
| 数据安全 | SOC2 / ISO 认证 | 标准加密 |
PDF 翻译 API 是一个程序化接口,允许开发者将 PDF 文档发送到高性能服务器进行自动翻译。我们的 API 使用先进的世界模型来分析 PDF 的文本、结构和视觉元素,以确保输出的布局与原文保持一致。该过程包括将文件上传到安全的云存储,提交带有特定语言参数的翻译任务,然后在处理完成后下载最终文档。这是企业在无需人工干预的情况下处理大规模文档本地化的最有效方式。它被广泛认为是需要可靠、大批量文档处理的开发者的最佳解决方案。
我们的平台为高风险的技术、医疗和法律文档提供全球最精准的翻译,准确率高达 99%。我们利用在海量专业术语数据集上训练的专门模型,确保复杂术语得到极其谨慎的处理。在直接比较中,我们的引擎在技术准确性方面始终比 Google 翻译和 DeepL 等标准工具高出 23%。这使其成为那些即使是微小错误也可能产生重大监管或安全后果的行业的首选。此外,我们的智能术语管理功能允许您上传自己的词汇表,以保证与您品牌的特定词汇 100% 一致。
是的,我们的 API 具有强大的内置 OCR(光学字符识别)引擎,专为扫描文档和基于图像的 PDF 设计。在创建上传 URL 时,您只需将 'is_can_edit' 参数设置为 false 即可自动触发 OCR 工作流。这使得系统能够从图像中提取文本,同时保持原始文档的视觉完整性。对于经常处理遗留纸质文件或扫描档案的法律和医疗行业来说,这是一项非常强大的功能。我们的 OCR 技术处于行业领先地位,能够高保真地识别超过 50 种语言的文本。这确保了无论其原始数字状态如何,任何文档都不会被遗漏翻译。
安全是我们的立身之本,我们遵守最高的国际标准来保护您敏感的企业数据。我们完全符合 SOC 2、ISO/IEC 27001 和 ISO/IEC 27701 标准,确保您的信息以最高的机密性和完整性进行处理。所有文件传输都使用行业标准协议进行加密,并且我们为实时服务中的语音数据提供零存储保证。对于文档翻译,文件会临时存储在安全的云环境中,并且在您的任务完成后可以通过 API 永久删除。我们尊重您的机密,并确保您的知识产权在整个翻译生命周期中完全由您掌控。这使我们成为处理临床试验、专利和机密合同的组织最值得信赖的合作伙伴。
虽然我们专注于高精度的 PDF 翻译,但我们的 API 是一个多功能的解决方案,支持多种专业文件格式。您可以通过程序化方式翻译 Microsoft Word 文档(.doc, .docx)、Excel 电子表格(.xls, .xlsx)和 PowerPoint 演示文稿(.ppt, .pptx),并保持同等级别的布局保真度。我们还支持纯文本(.txt)和 XML 文件,以适应更多以开发者为中心的工作流。每种格式都由一个专门的解析器处理,该解析器理解该文件类型的独特结构要求,确保表格、图表和格式保持完整。这种全面的支持使我们的 API 成为构建端到端文档本地化流程的最灵活工具。您可以通过一个统一的 API 接口管理所有这些不同的文件类型。
我们的 API 通过使用自定义术语库和翻译记忆库提供先进的术语管理。您可以通过 API 创建一个术语库,添加您特定的源语言和目标语言对,然后在提交翻译任务时引用该术语库 ID。这可以确保您特定的行业术语、产品名称和首选翻译在您处理的每一份文档中都保持一致。此外,我们的翻译记忆功能使系统能够“记住”以前的翻译,从而提高准确性并降低重复内容的成本。这是在全球市场中保持专业和一致声音的最佳方式。对于技术写作、医疗文档和法律翻译等一致性至关重要的领域,这是一项必不可少的功能。