project_automata
project_automata 是一个以 OCR 为核心的桌面自动化脚手架,适合把重复性的桌面操作自动化(例如表单录入、批量处理等)。
https://github.com/CNSeniorious000/project_automata
实现上用 OCR(如 EasyOCR)定位屏幕上的文本或控件,然后用 pyautogui 等工具模拟鼠标键盘进行交互,并配套了重试和刷新机制以提高鲁棒性。
使用场景
对于没有标准 API 的老旧桌面应用,OCR + 自动化是最快的工程化路径:它把 GUI 当成输入/输出介质,适合自动化迁移或临时替代方案。
相关:
- RPA-Python:常用的 Python RPA 库。
- rpaframework:工业级 RPA 框架。
这是个偏原型的工程,适合做快速验证与对接。
深入洞见¶
这个项目从 OCR 桌面自动化原型转向 Selenium 驱动的网页表单自动化,使用 XPath 导航和重试机制处理动态表单。结合 EasyOCR 和 ddddocr 提高 OCR 准确性,但最终聚焦于特定健康申报场景。
参考源码:main.py(Selenium 表单自动化) · older.py(OCR 原型)