如何判斷代理IP是否使用成功?
很多初次用代理IP的小伙伴都會有這樣的疑惑:在爬蟲程序或采集軟件上配置代理后,該如何判斷代理IP是否使用成功了呢?天啟HTTP代理告訴你!
其實可以借助查詢IP地址的這類網站,使用代理IP后,再去瀏覽器搜索百度IP或者訪問https://www.ip138.com。這類網站會將HTTP請求的來源IP獲取并通過HTTP內容返回,如果代理IP轉發成功,目標網站返回的內容就應該是代理IP地址。一般會有下面幾種情況:
1、代理直接轉發
只要將返回的IP地址復制進入百度IP或者https://www.ip138.com進行檢查,如果是爬蟲服務器的IP地址表示代理IP轉發失敗,否則就表示代理IP轉發成功。
2、代理多次轉發
查詢IP地址網站返回的內容,既不是爬蟲服務器的IP地址,也不是爬蟲程序或采集軟件直接使用的代理IP地址,而是經過代理IP多次轉發后,最后請求IP地址網站的代理IP地址。
3、代理自動轉發
部分代理IP產品,會根據爬蟲程序或采集軟件的每個HTTP請求,自動分配不同的代理IP進行轉發,出現每一次查詢獲取的IP地址都不一樣,這樣就能在數據采集的過程中,突破目標網站的IP限制行為。要注意這其中又會出現更復雜的情況是,部分IP查詢網站會按照cookie等信息直接緩存返回內容,即使代理IP每次請求都會轉發不同IP,這類IP查詢網站也會返回重復的IP地址,造成代理IP自動轉發失敗的假象,下面提供demo 示例如下:
package main
import (
"net/url"
"net/http"
"bytes"
"fmt"
"io/ioutil"
)
// 代理服務器(產品官網 http://m.gdsenyan.com/)
const ProxyServer = "t.16yun.cn:31111"
type ProxyAuth struct {
Username string
Password string
}
func (p ProxyAuth) ProxyClient() http.Client {
var proxyURL *url.URL
if p.Username != ""&& p.Password!="" {
proxyURL, _ = url.Parse("http://" + p.Username + ":" + p.Password + "@" + ProxyServer)
}else{
proxyURL, _ = url.Parse("http://" + ProxyServer)
}
return http.Client{Transport: &http.Transport{Proxy:http.ProxyURL(proxyURL)}}
}
func main() {
targetURI := "https://httpbin.org/ip"
// 初始化 proxy http client
client := ProxyAuth{"username", "password"}.ProxyClient()
request, _ := http.NewRequest("GET", targetURI, bytes.NewBuffer([] byte(``)))
// 設置Proxy-Tunnel
// rand.Seed(time.Now().UnixNano())
// tunnel := rand.Intn(10000)
// request.Header.Set("Proxy-Tunnel", strconv.Itoa(tunnel) )
response, err := client.Do(request)
if err != nil {
panic("failed to connect: " + err.Error())
} else {
bodyByte, err := ioutil.ReadAll(response.Body)
if err != nil {
fmt.Println("讀取 Body 時出錯", err)
return
}
response.Body.Close()
body := string(bodyByte)
fmt.Println("Response Status:", response.Status)
fmt.Println("Response Header:", response.Header)
fmt.Println("Response Body:\n", body)
}
}