亚洲欧美日韩久久_国产精品观看_新超碰97_国产精品久久毛片av大全日韩_日日操夜夜操天天操_日韩精品免费一区

虛擬主機被搜索引擎爬蟲訪問耗費大量流量解決方法

日期:2016/8/3 / 人氣:

問題場景:客戶使用虛擬主機,網站被搜索引擎爬蟲訪問耗費大量流量和帶寬,如何處理

解決方法:可以通過在站點根目錄下創(chuàng)建Robots.txt,Robots.txt文件是網站的一個文件,搜索引擎蜘蛛抓取網站首先就是抓取這個文件,根據(jù)里面的內容來決定對網站文件訪問的范圍。它能夠保護我們的一些文件不暴露在搜索引擎之下,從而有效的控制蜘蛛的爬取路徑。

1、首先,先了解一下目前搜索引擎和其對應的User-Agent,如下:

搜索引擎         User-Agent
AltaVista        Scooter
baidu            Baiduspider
Infoseek         Infoseek
Hotbot           Slurp
AOL Search       Slurp
Excite           ArchitextSpider
Google           Googlebot
Goto             Slurp
Lycos            Lycos
MSN              Slurp
Netscape         Googlebot
NorthernLight    Gulliver
WebCrawler       ArchitextSpider
Iwon             Slurp
Fast             Fast
DirectHit        Grabber
Yahoo Web Pages  Googlebot
LooksmartWebPages Slurp
2、Robots.txt樣例代碼:

例1. 禁止所有搜索引擎訪問網站的任何部分
User-agent: *
Disallow: /
例2. 允許所有的搜索引擎訪問網站的任何部分
User-agent: *
Disallow:
例3. 僅禁止Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow: /
例4. 僅允許Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow:
例5. 禁止spider訪問特定目錄
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /data/
注意事項:1)三個目錄要分別寫。
2)請注意最后要帶斜杠。
3)帶斜杠與不帶斜杠的區(qū)別。
例6. 允許訪問特定目錄中的部分url
實現(xiàn)a目錄下只有b.htm允許訪問
User-agent: *
Allow: /a/b.htm
Disallow: /a/

 

作者:朋友圈科技


Go To Top 回頂部
主站蜘蛛池模板: 国产免费一区 | 日韩三级网址 | 午夜在线电影 | 国内精品久久久久 | 亚洲国产精品久久久久久 | 观看av| 精品欧美一区二区三区久久久 | 亚洲精品成人悠悠色影视 | 久久中文字幕一区 | 久久中文字幕一区 | 山岸逢花在线观看无删减 | 国产成人精品免高潮在线观看 | 天天草天天干 | 国产超碰人人爽人人做人人爱 | 精品福利一区二区三区 | 国产视频一区二区 | eeuss国产一区二区三区四区 | 日韩激情免费视频 | 韩日在线观看视频 | 免费一级网站 | 亚洲精品在线视频观看 | 小情侣高清国产在线播放 | 久在线视频 | 成人精品一区二区三区 | 亚洲视频精品 | 国产亚洲欧美另类一区二区三区 | 免费一级毛片 | 一级片在线观看 | 精品一二区 | 成人免费视频视频在线观看 免费 | 久久久精品456亚洲影院 | 免费看男女www网站入口在线 | 精品96久久久久久中文字幕无 | 国产精品a级 | 免费操片 | 亚洲精品无 | 中文字幕在线三区 | 久久久久久久久久久久国产精品 | 欧美黄色影院 | 亚洲免费中文字幕 | 久久精品亚洲精品国产欧美 |