✨ VLM 增强原生 OCR

看见,
即理解。

用遮罩翻译文字,用 VLM 理解世界。专为 macOS 打造,隐私计算与端侧运行的完美结合。

适用于外文游戏、漫画生肉、学术 PPT 与手写笔记。

原始画面

ドカン!!

このプロトタイプ、来週までに仕上げる。

Mask 翻译结果

轰!

这个原型,下周前必须完成。

遮罩即所得,融合不破坏

框选你关心的区域,翻译结果在原位完美融合显示,丝毫不打断您的内容阅读节奏。

📸 传统截图翻译

  • 需要手动截图、等待上传、切换窗口查看结果
  • 译文脱离原画面,语境大打折扣,容易误读
  • 重复操作非常繁琐,严重破坏沉浸式阅读体验

✨ Mask 无缝翻译

  • 一键框选对话区域,译文即刻呈现
  • 译文自动在原位置覆盖,视觉连续不割裂
  • 为连续阅读与游戏玩家专门设计的无缝体验

领先的核心科技

基于苹果系统级原生 API 与先进的大型视觉模型驱动。

🧠

VLM 场景感知理解

不仅仅是文本 OCR。Mask 能够利用 VLM(视觉语言模型)理解图像上下文,精确翻译漫画拟声词、图表趋势甚至手写草图。

🛡️

绝对的端侧隐私保护

采用 Apple Vision 框架,图像截取与文字提取全部在您的设备本地完成。除非主动启用云端模型,图像绝不离开您的 Mac。

⚡️

随时切换引擎

内置支持 OpenAI, Claude, Gemini, Qwen, DeepSeek。更可连接本地 Ollama 实例,真正实现零成本、完全离线的翻译体验。

不止于文字,更懂画面

传统 OCR 只会生硬地提取字母。Mask 的 VLM 能够真正“看懂”眼前的一切。

场景类型 传统 OCR 翻译工具 Mask(VLM 增强翻译)
带有草图的手写会议笔记 只能识别零散的个别单词,翻译结果如乱码般生硬 理解为您在绘制“应用架构图”,给出连贯的设计思路翻译
日漫中夸张的艺术拟声词 完全无法识别特殊字体结构,或提取错误导致崩溃 根据画面动作判断出“ドカン”,并智能翻译为“轰隆!”
满是数据的学术图表 割裂地翻译坐标轴上的几个短词,完全脱离上下文 自动提炼数据的变化趋势,并用极具可读性的自然语言为您总结

适配您的任何主要工作流

🎮 畅玩外文生肉游戏

实时翻译游戏系统界面、物品描述与核心剧情对话,无需 Alt-Tab 切换,享受极致沉浸感。

📖 高效啃食原版漫画

精准框选漫画对话框。保留原汁原味绝美画风的同时,用母语进行流畅顺滑的剧情补完。

📊 攻克海外学术材料

轻松应对外文 PPT 与专业文献,不漏过任何繁杂的配图注释,提升您的研究效率。

✍️ 梳理手绘草图

快速将海外团队成员随手画的长篇大论和粗略排版图数字翻译为您的母语。

您的隐私,绝不妥协

您屏幕上的内容是您的核心机密。我们誓死捍卫这一点。

💻

系统级截图

调用原生 SCKit 高效截取

🔒

本地神经引擎

100% 离线完成文字特征提取

悬浮层反馈

贴合物体表面生成渲染效果

准备好看见并理解世界了吗?

今天就在您的 Mac 上体验毫无违和感的环境级翻译魔法。

免费下载针对 macOS 的 Mask

最低系统要求:macOS 14.0 Sonoma 及以后的版本。