免费可以看的无遮挡av无码|国产在线拍揄自揄视频网站|在线无码精品视频播放在|欧美亚洲国产成人精品,国产成人久久77777精品,亚洲欧美视频在线观看,色偷偷色噜噜狠狠网站久久

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > 使用python測(cè)試網(wǎng)頁(yè)中超鏈接的連通性

使用python測(cè)試網(wǎng)頁(yè)中超鏈接的連通性

來(lái)源:千鋒教育
發(fā)布人:xqq
時(shí)間: 2023-11-06 22:08:43 1699279723

在web測(cè)試,對(duì)網(wǎng)頁(yè)中的超鏈接進(jìn)行測(cè)試是最基本的工作,最簡(jiǎn)便的方法當(dāng)然是使用像xenu之類(lèi)的工具。但它具體是怎么實(shí)現(xiàn)的呢?我想也無(wú)外乎是通過(guò)http協(xié)議,根據(jù)超鏈接地址,向服務(wù)端發(fā)送請(qǐng)求,然后根據(jù)返回的信息進(jìn)行判斷連接的狀態(tài)。下面是根據(jù)這種思路,用python編寫(xiě)的檢測(cè)網(wǎng)頁(yè)鏈接連通性的程序。

首先,建立一個(gè)示例網(wǎng)頁(yè),其中l(wèi)ink1,lin3是不連通的,link2,link4是有效鏈接

Test

http://http://www.em-kal.com/">link1>
link2
link3
http://www.e70w.com/">link4>

使用python進(jìn)行鏈接檢測(cè),要使用到4個(gè)重要模塊,過(guò)程就是通過(guò)urllib抓取目標(biāo)網(wǎng)頁(yè)的html代碼,然后通過(guò)sgmllib模塊解析html,獲取超鏈接的列表。然后使用urlparse解析超鏈接的url,供httplib使用。然后由httplib模塊進(jìn)行最后的請(qǐng)求及驗(yàn)證回復(fù)的過(guò)程。

sgmllib:用于HTML解析,解析出網(wǎng)頁(yè)中包含的超鏈接

httplib:用于Http協(xié)議的操作

urllib:用于獲取網(wǎng)頁(yè)的html代碼

urlparse:解析url地址,把url地址解析成幾個(gè)部分。

具體實(shí)現(xiàn)代碼如下:

#-×-coding:gb2312-*-

importhttplib,urllib,urlparse

fromsgmllibimportSGMLParser

#解析指定的網(wǎng)頁(yè)的html,得到該頁(yè)面的超鏈接列表

classURLLister(SGMLParser):

defreset(self):

SGMLParser.reset(self)

self.urls=[]

defstart_a(self,attrs):

href=[vfork,vinattrsifk=='href']

ifhref:

self.urls.extend(href)

#遍歷超鏈接列表,并逐個(gè)的發(fā)送請(qǐng)求,判斷接收后的代碼,200為正常,其他為不正常

deffetch(host):

usock=urllib.urlopen(host)

parser=URLLister()

parser.feed(usock.read())

uhost=urlparse.urlparse(host)

forurlinparser.urls:

up=urlparse.urlparse(url)

#因?yàn)槌溄佑袃煞N方式:一種是直接的http://......一種是相對(duì)路徑,/.../sample.html

#所以要分別處理

ifup.netloc=="":

http=httplib.HTTP(uhost.netloc)

http.putrequest("GET","/"+up.path+"?"+up.params+up.query+up.fragment)

http.putheader("Accept","*/*")

http.endheaders()

else:

http=httplib.HTTP(up.netloc)

http.putrequest("GET",up.path+"?"+up.params+up.query+up.fragment)

http.putheader("Accept","*/*")

http.endheaders()

errcode,errmsg,headers=http.getreply()

iferrcode==200:

printurl,":ok"

else:

printurl,":",errcode

#測(cè)試

fetch("http://www.em-kal.com/")

代碼運(yùn)行的結(jié)果:

http://www.em-kal.com/erwerwe.html:404

/sample/lik.html:ok

/sample/lik2.html:404

http://www.em-kal.com/:ok

以上內(nèi)容為大家介紹了使用python測(cè)試網(wǎng)頁(yè)中超鏈接的連通性,希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://www.em-kal.com/

聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專(zhuān)屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
Python中的'==' 和 'is'

==和is是Python對(duì)象比較中常用的兩種方式,==比較對(duì)象的值是否相等,is比較對(duì)象的身份標(biāo)識(shí)(ID)是否相等,是否是同一個(gè)對(duì)象,是否指向同一個(gè)內(nèi)存...詳情>>

2023-11-06 23:38:43
Python內(nèi)存分配

一、前言大多數(shù)編譯型語(yǔ)言,變量在使用前必須先聲明,其中C語(yǔ)言更加苛刻:變量聲明必須位于代碼塊最開(kāi)始,且在任何其他語(yǔ)句之前。其他語(yǔ)言,想C...詳情>>

2023-11-06 22:33:55
Python 腳本自啟動(dòng)及定時(shí)任務(wù)

讓Python隨Linux開(kāi)機(jī)自動(dòng)運(yùn)行1、準(zhǔn)備好要自啟的腳本auto.py2、用root權(quán)限編輯以下文件sudovim/ect/rc.local3、在exit0上面編輯啟動(dòng)腳本的命令/u...詳情>>

2023-11-06 21:57:55
python字符串處理相關(guān)函數(shù)

python中字符串中字符大小寫(xiě)的變換:*S.lower()#小寫(xiě)*S.upper()#大寫(xiě)*S.swapcase()#大小寫(xiě)互換*S.capitalize()#首字母大寫(xiě)*String.capwor詳情>>

2023-11-06 21:54:19
如何在Linux中運(yùn)行Python源文件

一??蓤?zhí)行的Python程序這部分內(nèi)容只對(duì)Linux/Unix用戶(hù)適用,不過(guò)Windows用戶(hù)可能也對(duì)程序的第一行比較好奇。首先我們需要通過(guò)chmod命令,給程序...詳情>>

2023-11-06 21:50:43