翻译PDF听起来简单,直到你真正尝试。将文本粘贴到翻译应用里,所有格式都丢失了。使用在线转换器,表格会变得支离破碎。用桌面工具处理,标题却变成了正文。等到你手动重新组装好文档时,花在清理上的时间已经超过了翻译本身。
问题不在于翻译质量——AI翻译已经变得相当出色。问题在于,大多数工具在设计时并未考虑文档结构。本指南将介绍真正有效的方法、每种方法在时间和金钱上的成本,以及如何根据你的文档类型选择正确的方法。
为什么翻译PDF会丢失格式
PDF是一种呈现格式。与将内容存储为结构化数据的Word文档或HTML不同,PDF将内容存储为定位好的图形元素。一个标题并未被标记为标题——它只是位于特定坐标、使用特定字体大小的一段文本。一个表格也不是由单元格组成的网格——它只是一系列线条和文本框,碰巧看起来像个表格。
这意味着,任何工具要翻译PDF,都必须先解读其布局结构——弄清楚哪些是标题、哪些是正文、哪些是表格、哪些内容属于哪一列——然后才能翻译内容并重建文档。大多数工具正是在这个布局解读环节上失败了。
那些做得好的工具,将扫描文档的OCR、布局分析、翻译和文档重建整合到一个单一的流程中。这是一个比纯翻译更复杂的技术难题,因此需要更长的时间才能妥善解决。
方法一:AI驱动的桌面翻译(最佳效果)
对于大多数专业文档,支持原生文档处理的专用AI翻译工具是最佳选择。Linguin的Mac应用能够端到端处理PDF翻译,无需任何中间步骤。
如何使用Linguin翻译PDF:
- 从菜单栏打开Linguin Mac应用
- 将PDF文件拖放到翻译窗口,或使用“文件”>“打开”
- Linguin会自动检测源语言
- 从选择器中选择目标语言
- 点击“翻译文档”
Linguin会处理文档并生成一个保留原始布局的翻译版本。表格结构得以保持,标题层级得以维持,多栏布局得到尊重,粗体或斜体格式也得以保留。输出结果会在并排视图中打开,方便你在导出前比较原文和译文。
对于大多数商业文档、报告、研究论文和技术手册,翻译结果可以立即使用。布局特殊的复杂文档可能需要进行微调,但你是从一个结构良好的草稿开始,而不是一堆混乱的输出。
方法二:在线PDF翻译服务
一些基于网络的服务能以尚可的质量处理PDF翻译,适用于不包含复杂布局的文档:
Google翻译 可通过网页界面上传PDF并返回翻译后的文档。近年来质量已有显著提升,但格式保留方面仍不稳定。简单的单栏文档能保持整洁;任何包含表格、分栏或复杂视觉结构的文档,其布局都容易丢失。
DeepL 在付费计划中提供文档翻译功能。其翻译质量本身非常出色,尤其是对于欧洲语言,格式保留也比Google的工具更好。限制在于,其基础计划仅支持Word、PowerPoint和纯文本文件上传;PDF支持需要更高阶的套餐。
Adobe Acrobat 在新版本中包含了由Microsoft Azure提供支持的翻译功能。如果你已经付费使用Acrobat,这值得一试,尽管其翻译质量更接近Microsoft Translator,而非那些以AI为先的工具。
在线服务适用于偶尔的翻译需求,且你不想安装软件。值得注意的隐私考量是,你需要将文档内容上传到第三方服务器,这对于机密文档来说很重要。
方法三:复制粘贴与手动重建
最古老的方法——复制所有文本,粘贴到翻译工具中,然后手动将其放回新文档——有时仍然是正确的答案。如果文档简短、简单且格式直接,手动方法能让你对输出拥有最大的控制权。
从PDF复制粘贴时,文本提取的顺序并不总是与视觉顺序一致。多栏文档可能会以混乱的顺序粘贴,因为PDF阅读器会先从左到右读取各栏,再从上到下读取。在这种情况下,手动逐栏复制能为翻译工具提供更清晰的输入。
此方法对于超过几页的文档不切实际,但对于需要严格控制每个单词的单页文档,它仍然是一个有效的选择。
处理扫描PDF和基于图像的文档
扫描PDF完全是另一个挑战。从计算机的角度看,扫描文档就是一张图片——如果不先运行OCR,就无法提取任何文本。
Linguin在检测到扫描PDF时会自动应用OCR。OCR质量在很大程度上取决于扫描质量:
- 以300 DPI或更高分辨率扫描的文档翻译效果良好
- 文本与背景对比度高的页面能干净地提取
- 手写体和特殊字体可能需要手动校正
- 低质量或损坏的扫描件通常需要在翻译前进行预处理
对于已扫描的常规办公文档和学术论文,Linguin的OCR流程可以无需手动步骤就完成提取和翻译。对于历史文档、手写记录或质量不佳的扫描件,值得先使用像ABBYY FineReader这样的专用OCR工具来清理提取结果,再将其送入翻译工具。
保留特定的文档元素
不同类型的文档面临不同的格式保留挑战:
表格: PDF中的表格被解读为布局结构,而非数据。好的翻译工具能检测表格边界并保留它们。当表格返回时变得混乱,通常是因为PDF的内部结构没有清晰地界定表格。在这种情况下,单独复制表格并将其作为纯文本翻译,然后重新插入,通常能产生更清晰的结果。
页眉和页脚: 页眉、页码和页脚内容在PDF结构中通常与正文分开存储。它们可能会被单独翻译,或者根本不翻译。请检查翻译后的文档中是否有缺失或翻译错误的页眉和页脚内容。
包含文本的嵌入图像: 图表、示意图和包含文本的屏幕截图不会被文档翻译工具翻译——因为文本是图像的一部分,而非可提取的文本。这些需要手动处理。
脚注和尾注: 脚注标记和注释内容有时在翻译过程中会变得分离。请检查任何包含大量脚注的文档,确保标记和注释仍然正确对应。
何时使用人工翻译
对于大多数专业和信息类内容,AI文档翻译确实非常出色。但在某些类别中,人工翻译仍然是正确的选择:
具有法律约束力的文件,其精确性至关重要,误译可能产生责任——如合同、法庭文件、监管申报文件——至少需要专业审校,通常还需要完整的人工翻译。
医疗和制药文件,其术语必须精确,翻译错误可能影响患者护理。
营销和品牌内容,需要的是文化适应而非字面翻译。一个在德语中能引起共鸣的产品描述,可能需要超越词语替换的重大调整,才能在日语中发挥作用。
文学和创意作品,其风格和语气与意义同等重要。
对于其他一切——商业报告、技术文档、学术论文、信函、产品手册和研究——2026年的AI翻译已经能产生足够准确和自然的、可以直接使用的结果。相比人工翻译流程,节省的时间是巨大的。关于商务信函翻译的具体技巧,请阅读我们的指南:专业翻译电子邮件。
如果你经常处理多语言文档,也可以查看我们的2026年最佳翻译应用对比,以了解工具生态如何相互配合。