OpenClaw实战:用ADB+本地OCR打造全自动安卓设备智能管理助手
前言:ADB的痛点是什么? ADB(Android Debug Bridge)几乎是所有安卓玩机党、测试工程师的必备工具,我们可以用它执行截图、点击、安装应用、文件传输等几乎所有手机操作,但它有一个最大的短板:它只能执行命令,没法"看到"手机屏幕上的内容。 很多时候我们想做自动化操作,都会卡在"判断当前屏幕有什么"这一步:比如想跳过开屏广告,你得先知道"跳过"按钮在什么位置;想自动签到,得先识别到"签到"按钮有没有出现;想批量提取截图里的文字,得手动一张张复制。 今天我们就用OpenClaw的两个现成技能:ADB工具集 + 本地PaddleOCR,组合出一个完全本地化、零API费用、隐私安全的全自动安卓设备管理助手,实现"识别→决策→操作"的完整闭环。 一、整体方案设计 整个架构非常简单,三层结构完全跑在本地,不需要任何云端服务: 1 2 3 4 ┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐ │ ADB交互层 │ → │ PaddleOCR识别层 │ → │ OpenClaw逻辑层 │ │ (手机操作) │ │(文字+坐标识别) │ │(规则判断+调度)│ └─────────────────┘ └─────────────────┘ └─────────────────┘ 各层职责: ADB层:负责和安卓设备交互,支持截图、点击、滑动、启动应用、拉取/推送文件、执行Shell命令等所有ADB原生能力 OCR层:基于本地PaddleOCR实现,识别截图中的文字内容和对应坐标位置,全程本地运行,不会上传任何图片到第三方 逻辑层:OpenClaw作为调度中心,把两个能力串联起来,支持自定义规则,甚至可以用自然语言直接控制(比如"帮我把手机里的所有账单截图文字提取出来") 二、前置环境准备 2.1 技能安装 首先确保你已经在OpenClaw中安装了两个必备技能: 1 2 3 4 5 # 安装ADB工具集技能 openclaw skills install adb # 安装本地PaddleOCR技能 openclaw skills install paddle-ocrv5 安装完成后运行openclaw skills list确认两个技能状态都是✓ ready。 2.2 ADB设备连接 安卓手机开启「开发者选项」→ 打开「USB调试」,用USB连接电脑,或者通过Wi-Fi无线连接 执行adb devices确认设备已经连接成功,能看到设备ID输出 (可选)配置ADB路径到系统环境变量,或者在TOOLS.md中配置你的ADB实际路径 2.3 本地OCR服务启动 PaddleOCR技能默认会启动本地MCP服务在端口18080,启动后可以通过lsof -i:18080确认服务正常运行。 ...