1#
本帖最后由 66球 于 2015-7-1 17:10 编辑

不要在一个元素特征字符串上吊死






本文按键学院提供技术支持



按键学院交流①群(1群已满):376122403

按键学院交流②群(2群):372671254

按键学院交流③群(3群):170084238




最近经常有遇到新手童鞋反馈,表示使用网页wqm自动分析出的元素特征字符串,测试时死活没有反应,导致无法实现自动点击页面元素等操作,结果往往是换了下特征串的组合就正常了,事后这些童鞋才明白原来元素特征值之间是可以自行组合形成新的元素特征字符串的,所以参考了之前的院刊和资源库资料,重新对这方面整合了下,希望可以帮助新手更好的了解元素特征字符串

[tr=rgb(154, 205, 50)]
什么是网页元素特征字符串?

要了解什么是网页元素特征字符串(以下简称特征串)首先得了解什么是网页,什么是HTML?
从维基百科上可查询到网页定义如下:

网页是一个文件,他存放在世界某个角落的的某一台计算机中,而这台计算机必须是与互联网相连的。网页经由网址( URL )来识别与存取,当我们在浏览器输入网址后,经过一段复杂而又快速的程序,网页文件会被传送到你的计算机,然后再通过浏览器解释网页的内容,再展示到你的眼前。是万维网中的一“页”,通常是HTML格式(文件扩展名为.html或.htm)。网页通常用图像档来提供图画。网页要透过网页浏览器来阅读。网页通常有以下元素:文字资料,图像档案,Applet(在页面内执行的副程式)超链结等。

网页通常都是HTML格式的文件,经浏览器解释之后生成的页面,我们要分析网页,首先得了解HTML语言。再查维基百科,HTML定义如下:

超文本置标语言(英文:HyperText Markup Language,简称为HTML)是为「网页创建和其它可在网页浏览器中看到的信息」设计的一种置标语言。HTML被用来结构化信息——例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。由蒂姆·伯纳斯-李给出原始定义,由IETF用简化的SGML(标准通用置标语言)语法进行进一步发展的HTML,后来成为国际标准,由万维网联盟(W3C)维护。

HTML语言是一种标记语言,咱们通过查看很多网页的页面源文件不难发现它们通常都是由成对的< > … 包含起来的元素组成,各种不同的元素具备不同的标记名称,有不同的属性。例如百度网页里的,咱们用360浏览器打开百度,右键按钮位置审查元素,提示百度一下按钮的html代码如下:

百度一下按钮具备的属性:type(类型)、value(特征)、id(唯一标识),这些属性的值分辨是:submit、"百度一下"、su

而通常我们使用网页WQM主要是实现自动填表之类的功能,需要面对的主要是表单。

所以在讲解特征串之前,先简介一下表单,在网页源文件中有一种表单标记,在这些标记之间可以添加