图像识别&OCR
#
裁剪区域裁剪后返回一个 图像元素
函数列表
// 裁剪函数, 裁剪部分图像def crop(): ImageElement// 裁剪页面元素,或数字def crop(locator: Any): ImageElementdef crop(x: Any, y: Any): ImageElementdef crop(x: Any, y: Any, width: Any, height: Any): ImageElement
可传入 1 个、2 个或 4 个数字, 整数代表像素,小数代表比率, 示例:
* img.corp('.divClass')# 同 corp(0.5, 0.5) 中间区域,宽高占50%* img.corp(0.5)# 中间区域,宽600像素,高占400 像素* img.corp(600, 400)# 起点中央,400*400* img.corp(0.5, 0.5, 400, 400)
#
图像点击// 图像匹配点击def click(file: String): Unitdef click(locator: String, file: String): Unitdef click(source: Array[Byte], target: Array[Byte]): Unit
示例
* img.click('#lg', 'baidu.png')
#
图像匹配// 找到所有匹配到的图片元素def `match`(file: String): util.List[ImageElement]def `match`(locator: String, file: String): util.List[ImageElement]
#
相似度比较// 图片相似度对比def compare(file: String): Doubledef compare(locator: String, file: String): Doubledef compare(reference: Array[Byte], file: String): Doubledef compare(reference: Array[Byte], target: Array[Byte]): Doubledef diff(file: String): Doubledef diff(locator: String, file: String): Doubledef diff(reference: Array[Byte], target: Array[Byte]): Double
示例
* print img.diff('#lg', 'baidu.png')* print img.diff('#s_lg_img', 'baidu.png')* print img.compare('#s_lg_img', 'baidu.png')
#
有效区域检测// 图像识别区域检测,调试用def detect(): DetectorResultdef detect(method: String): DetectorResultdef detect(locator: String, method: String, options: util.Map[String, Any]): DetectorResultdef detect(bytes: Array[Byte], method: String, options: util.Map[String, Any]): DetectorResult
#
OCR 识别def click(text: String): Unitdef click(locator: String, text: String): Unitdef extract(): Stringdef extract(locator: String): Stringdef extract(locator: String, level: String): Stringdef extract(locator: String, level: String, negative: Boolean): String
level | 说明 |
---|---|
block | 区域文本 |
para | 区分段落 |
line | 区分行 |
word | 区分单词(默认 |
symbol | 字符(默认) |
示例
* ocr.click('#s-top-left', '视频')# 识别出整个整个部分的字符* ocr.extract()# 第一个参数为定位表达式(提高识别准确率),第二个是 识别的模式见下表* ocr.extract('#img', 'word')# 第三个参数是否对图片进行‘bitwise_not’操作, 如果输入图片是 黑底白字 设置true, 默认 false* ocr.extract('#img', 'word', true)