Skip to main content

图像识别&OCR

裁剪区域#

裁剪后返回一个 图像元素

函数列表

// 裁剪函数, 裁剪部分图像def crop(): ImageElement// 裁剪页面元素,或数字def crop(locator: Any): ImageElementdef crop(x: Any, y: Any): ImageElementdef crop(x: Any, y: Any, width: Any, height: Any): ImageElement

可传入 1 个、2 个或 4 个数字, 整数代表像素,小数代表比率, 示例:

* img.corp('.divClass')# 同 corp(0.5, 0.5) 中间区域,宽高占50%* img.corp(0.5)# 中间区域,宽600像素,高占400 像素* img.corp(600, 400)# 起点中央,400*400* img.corp(0.5, 0.5, 400, 400)

图像点击#

// 图像匹配点击def click(file: String): Unitdef click(locator: String, file: String): Unitdef click(source: Array[Byte], target: Array[Byte]): Unit

示例

* img.click('#lg', 'baidu.png')

图像匹配#

// 找到所有匹配到的图片元素def `match`(file: String): util.List[ImageElement]def `match`(locator: String, file: String): util.List[ImageElement]

相似度比较#

// 图片相似度对比def compare(file: String): Doubledef compare(locator: String, file: String): Doubledef compare(reference: Array[Byte], file: String): Doubledef compare(reference: Array[Byte], target: Array[Byte]): Doubledef diff(file: String): Doubledef diff(locator: String, file: String): Doubledef diff(reference: Array[Byte], target: Array[Byte]): Double

示例

* print img.diff('#lg', 'baidu.png')* print img.diff('#s_lg_img', 'baidu.png')* print img.compare('#s_lg_img', 'baidu.png')

有效区域检测#

// 图像识别区域检测,调试用def detect(): DetectorResultdef detect(method: String): DetectorResultdef detect(locator: String, method: String, options: util.Map[String, Any]): DetectorResultdef detect(bytes: Array[Byte], method: String, options: util.Map[String, Any]): DetectorResult

OCR 识别#

def click(text: String): Unitdef click(locator: String, text: String): Unitdef extract(): Stringdef extract(locator: String): Stringdef extract(locator: String, level: String): Stringdef extract(locator: String, level: String, negative: Boolean): String
level说明
block区域文本
para区分段落
line区分行
word区分单词(默认
symbol字符(默认)

示例

* ocr.click('#s-top-left', '视频')# 识别出整个整个部分的字符* ocr.extract()# 第一个参数为定位表达式(提高识别准确率),第二个是 识别的模式见下表* ocr.extract('#img', 'word')# 第三个参数是否对图片进行‘bitwise_not’操作, 如果输入图片是 黑底白字 设置true, 默认 false* ocr.extract('#img', 'word', true)