极品少妇一区二区三区精品视频,国内精品免费午夜毛片,亚洲欧美电影一区二区,麻豆一区二区

HTTP 代理服務器的架構

HTTP架構師一般都會使用很多種復雜的機制來將多個子模塊組合建成一個HTTP服務。現在的網絡爬蟲中,已經形成了4種基本的模式。如果已經編寫了用于生成動態內容的網絡爬蟲Python代碼,并且已經選擇了某個支持WSGI的API或框架,應該如何將HTTP服務部署到線上呢?

IP代理
第一步、運行一個使用網絡爬蟲Python編寫的服務器,服務器的代碼中可以直接調用WSGI接口。現在流行的是Green Unicorn(Gunicorn)服務器,不過也有其他已經可以用于生產環境的純Python服務器。

第二步、配置mod_wsgi并運行Apache,在一個獨立的WSFIDaemonProcess中運行Python代碼,由mod_wsgi啟動守護進程。

第三步、在后端運行一個類似于Gunicorn的Python HTTP服務器(或者支持所選異步框架的任何服務器),然后在前端運行一個既能返回靜態文件,又能對Python編寫的動態資源服務進行反向代理的Web服務器。

第四步、在前端運行一個純粹的反向代理(如Varnish),在該反向代理后端運行Apache或者nginx,在后端運行Python編寫的HTTP服務器。這是一個三層的架構。這些反向代理可以分布在不同的地理位置,這樣子就能夠將離客戶端近的反向代理上的緩存資源返回給發送請求的客戶端。

長期以來,對這4個架構的選擇主要基于CPython的3個運行時的特性,即解釋器占用內存大、解釋器運行慢、全局解釋器(GIL,Global Interpreter Lock)禁止多個線程同時運行Python字節碼。但同時帶來了內存中只能載入一定數量的Python實例。提供HTTP代理、HTTPS代理、Socks5代理等,住宅代理極速響應,保障用戶信息的安全。

主站蜘蛛池模板: 宁德市| 赞皇县| 泰来县| 长岛县| 永年县| 宁南县| 阿坝| 凤翔县| 满洲里市| 涿州市| 汕头市| 赤峰市| 龙里县| 孟州市| 广宗县| 呼玛县| 东方市| 江安县| 莲花县| 清镇市| 金沙县| 渭源县| 隆子县| 大邑县| 绥阳县| 凭祥市| 沁阳市| 化德县| 韶关市| 瓦房店市| 巴南区| 浠水县| 辉南县| 双桥区| 沧州市| 广平县| 本溪| 杂多县| 石柱| 元阳县| 门源|