如何即时翻译图片中的文字

探索在 Mac、iPhone 或浏览器上从任何图片中提取和翻译文字的最简单方法。视觉文本翻译的完整指南。

Linguin Team
A person holding a cell phone over a camera
Photo by Vardan Papikyan on Unsplash

在我们这个视觉驱动的数字世界里,文字并不局限于文档和网站。它存在于错误信息的截图中、社交媒体表情包的嵌入文字里、隐藏在外文网站的产品图片中,也保存在旅行时拍摄的历史铭牌或餐厅菜单的快照里。即时理解图片中的文字已不再是小众技能,而是现代数字素养的重要组成部分。

无论你是从外文出版物中收集数据的研究人员、在国际网站上购物的消费者、学习外语资料的学生,还是单纯充满好奇心的人,翻译图片文字都能为你打开一个信息世界。本指南将引导你了解在 Apple 设备和浏览器上直接从任何图片中提取和翻译文字的最有效、最无缝的方法。

OCR 的魔力:图片翻译的工作原理

在深入探讨“如何做”之前,先了解“是什么”会很有帮助。从图片中翻译文字是一个两步的技术过程:

  1. 光学字符识别 (OCR): 这是关键的第一步。OCR 软件分析图片中的像素,识别与字母和数字对应的模式,并将这些视觉模式转换为实际的机器编码文本。由机器学习驱动的现代 OCR 非常擅长处理各种字体、背景,甚至一些手写体。
  2. 机器翻译 (MT): 一旦文本被提取为字符串,它就会被输入到翻译引擎(如 Google Translate、DeepL 等)中,该引擎会解释源语言的含义,并在你的目标语言中重构它。

现代应用程序的魔力在于将这两个过程结合成一个流畅的动作。你指向文字,理解就出现了。这消除了过去繁琐的工作流程:保存图片、上传到网站、下载文本,然后粘贴到翻译器中。

Illustration

原生方法:Apple 设备上的内置工具

你可能会惊讶地发现,强大的图片翻译工具已经内置在你日常使用的 Apple 生态系统中。以下是如何利用它们。

在 macOS (Ventura 及更高版本) 上:

  1. 截取屏幕截图 (Cmd + Shift + 4) 或在 Mac 上保存任何图片。
  2. 预览 应用程序中打开图片。
  3. 用光标选择要翻译的文本。是的,你通常可以在预览中直接从图片中选择文本。如果文本不能立即选择,请右键单击图片并查找“从图片中拷贝文本”选项。
  4. 文本高亮显示后,右键单击并悬停在 “翻译” 选项上。翻译结果将显示在一个小弹出窗口中。你也可以使用 Ctrl+Cmd+T 快捷键。

在 iPhone 和 iPad (iOS/iPadOS 15 及更高版本) 上: 得益于“实况文本”,此功能更加无缝。

  1. 打开 相机 应用并将其对准文字,或在 照片 应用中打开任何包含文字的图片。
  2. 点击取景器或图片角落出现的 实况文本图标(方框中的几行小文字)。
  3. 拖动选择手柄以覆盖要翻译的文本。
  4. 点击 “翻译”。全屏翻译将出现,你甚至可以收听发音。

这些原生工具非常适合快速、一次性的翻译,尤其是在处理清晰的印刷体文字时。它们深度集成,并通过在设备上处理大部分信息来尊重你的隐私。

专用翻译应用的力量

虽然原生工具很方便,但功能可能有限。你可能需要在不截图的情况下翻译屏幕上特定区域的文字、翻译视频中的文字,或者保留翻译历史。这时,像 Linguin 这样由 AI 驱动的专用翻译应用就大放异彩了。

Linguin 旨在让视觉文本翻译成为你跨设备工作流程中一个核心、无摩擦的部分。如果你正在寻找翻译任何网站内容(不仅仅是图片)的更广泛策略,我们关于如何即时翻译网站的指南是一个天然的补充。以下是专业工具的不同之处:

  • 即时屏幕捕捉翻译: 使用 Linguin for macOS,你可以通过全局键盘快捷键(如 Option + T)调用翻译覆盖层。只需在屏幕上任何文字上拖动一个选择框——无论是在 PDF、视频播放器、设计工具还是游戏中——无需离开当前应用程序即可获得即时翻译。这对于实时理解非常有价值。
  • 浏览器扩展的卓越表现: Linguin Chrome 和 Safari 扩展 将网络上的图片翻译提升到了一个新的水平。将鼠标悬停在包含文字的图片上,点击一下,即可提取并翻译其内容。这非常适合翻译国际购物网站上的产品描述、信息图或嵌入式社交媒体图片,无需任何右键单击、保存或上传步骤。
  • 上下文准确性: 专用应用通常超越逐字翻译。它们可以利用上下文为习语、技术术语或歧义短语提供更准确的翻译。
  • 工作流程集成: 你可以轻松复制翻译后的文本、粘贴到文档中,或保存翻译以供日后参考,从而创建一个流畅的研究和学习流程。

使用专门为此目的构建的工具,可以将翻译从一个中断性任务转变为浏览和计算体验的自然延伸。

分步指南:使用 Linguin 翻译图片文字

让我们来看一个实际场景:你正在浏览一家日本网店,想了解产品照片中的规格说明。

在你的 Mac 上:

  1. 确保 Linguin 正在菜单栏中运行。
  2. 导航到包含产品图片的网页。
  3. 按下你配置的快捷键(例如 Option + T)。将出现一个半透明的覆盖层。
  4. 单击并拖动鼠标,在图片中的文字周围绘制一个矩形。
  5. 释放鼠标按钮。一秒钟内,Linguin 将显示提取的原始文本及其在你选择的目标语言中的翻译。
  6. 点击复制图标以在其他地方使用翻译后的文本。

使用 Linguin 浏览器扩展 (Chrome/Safari):

  1. 从 Chrome 网上应用店或 Safari 扩展库安装 Linguin Chrome 扩展
  2. 当你遇到带有文字的图片时,只需将鼠标悬停在图片上
  3. 会出现一个小的 Linguin 图标。点击它。
  4. 扩展程序将自动对图片文字执行 OCR 和翻译,并在页面上的一个干净弹出窗口中呈现结果。
  5. 你可以在原文和译文之间切换,或一键复制结果。

这个过程几乎消除了所有摩擦,让你能像阅读纯文本一样快速地理解视觉内容。

Illustration

实现准确图片翻译的最佳实践

要从任何图片翻译工具中获得最佳效果,请遵循以下提示:

  • 图片质量是关键: 确保图片中的文字尽可能清晰、对比度高。模糊、像素化或光线不足的图片即使对最好的 OCR 引擎也是挑战。
  • 注意字体和背景: 高度风格化的字体或放置在复杂图案背景上的文字会降低准确性。在可能的情况下,尽量在纯色背景下捕捉或截图文字。
  • 对于手写体: 虽然技术先进,但大多数工具仍针对印刷体文本进行了优化。整洁的方块手写体被准确识别的机会最大。
  • 提供上下文: 如果你使用的工具允许,有时提供关于上下文的提示(例如,“技术手册”、“餐厅菜单”)可以帮助翻译引擎选择最合适的术语。
  • 核实关键信息: 对于重要文件、法律文本或医疗信息,请将图片翻译作为理解的有用第一步,但务必通过人工翻译进行核实以确保绝对准确。

超越翻译:文本可访问性的更大图景

翻译图片文字背后的技术不仅仅是打破语言障碍。它是数字可访问性的基石。对于有视觉障碍的用户,OCR 结合文本转语音功能,可以让屏幕阅读器解读图形中的文字。它还使每个人都能与“锁定”在不可选择格式中的文本进行交互,将静态信息转变为可交互、可编辑和可用的数据。

能够即时从视觉世界中提取文字并用你的语言理解它,是一种超能力。它使信息民主化,加速学习,并简化工作、教育和旅行中的任务。通过掌握 Apple 设备上的原生工具,并用像 Linguin 这样功能强大、专为特定目的构建的应用来增强它们,你就能装备自己,自信而轻松地驾驭我们多语言的视觉世界。从尝试下一张照片上的内置“实况文本”功能开始,探索专用翻译器如何能简化你的日常数字生活。