百度小程序自动化遍历能力:通过各种遍历算法,获取小程序检测的必要信息
页面异常检测能力:对采集到的小程序相关信息进行自动检测
集群化:用以解决线上大规模并行巡检的手机资源问题
图像切分:利用像素扫描识别出图片内内容元素的边界。
文字识别:利用OCR技术识别出图片的的文本内容,包含文字内容以及每个文字的坐标信息。
图标识别:利用对象检测技术识别出图片内的图标信息,包含图标的类型以及对应的坐标信息。
色彩分析:分析图像切分得到的每个元素区块的噪点信息,颜色信息,用于后续辅助判断区域的类型。同时,也避免下图这种图片中含有文字的情况,对结构树的生成带来干扰。
元素属性判定:结合区域的文字信息,图标信息以及色彩信息判断元素区域的类型。
元素聚合:将切分较为零碎的本属于同一个元素的多个文本区域聚合为一个完整的区域。
区块划分:区域划分直线将图片划分成若干个独立的功能区域。
页面结构树生成:结合前面得到的一系列信息分析生成一个能够代表当前页面结构信息的JSON结构体。
利用区域内元素种类分布和元素间相对位置关系进行文章列表类控件的识别:
利用元素分布特征,发现存在的上方是图片,下方是文本且文本带有价格元祖,则判断为是商品卡片类控件:
利用OCR+元素特征,发现如果页面底部区域出现等距重复的元素,且图文结构高度相似,则判断为是底部tab控件:
页面结构树能力在非纯色背景图片下的局限性;
通过step3完成了深度学习模型需要的训练集的自动标注,再结合step上线后,采集到的badcase进行人工标注样本,将两类样本相结合进行训练得出的模型可以对原有方案进行补充召回。在选型方便,调研了业界常用的一些目标识别的算法。
全白屏/区域白屏/骨架屏:
页面长时间加载:
部分图片加载失败:
小度智能音箱*1
百度架构师
百度官方技术公众号上线啦!
技术干货 · 行业资讯 · 线上沙龙 · 行业大会
招聘信息 · 内推信息 · 技术书籍 · 百度周边
欢迎各位同学关注!