跳转至

project_automata

project_automata 是一个以 OCR 为核心的桌面自动化脚手架,适合把重复性的桌面操作自动化(例如表单录入、批量处理等)。

https://github.com/CNSeniorious000/project_automata

实现上用 OCR(如 EasyOCR)定位屏幕上的文本或控件,然后用 pyautogui 等工具模拟鼠标键盘进行交互,并配套了重试和刷新机制以提高鲁棒性。

使用场景

对于没有标准 API 的老旧桌面应用,OCR + 自动化是最快的工程化路径:它把 GUI 当成输入/输出介质,适合自动化迁移或临时替代方案。

相关:

这是个偏原型的工程,适合做快速验证与对接。

深入洞见

这个项目从 OCR 桌面自动化原型转向 Selenium 驱动的网页表单自动化,使用 XPath 导航和重试机制处理动态表单。结合 EasyOCR 和 ddddocr 提高 OCR 准确性,但最终聚焦于特定健康申报场景。

参考源码:main.py(Selenium 表单自动化) · older.py(OCR 原型)