首頁(yè) > 正文標(biāo)題
引:案件《百度訴360違反Robots協(xié)議稱或致隱私泄露》中,百度方面認(rèn)為,360搜索在未獲得百度公司允許的情況下,違反業(yè)內(nèi)公認(rèn)的Robots協(xié)議,抓取百度旗下百度知道、百度百科、百度貼吧等網(wǎng)站的內(nèi)容,已經(jīng)構(gòu)成了不正當(dāng)競(jìng)爭(zhēng),并向奇虎索賠1億元……
那么,什么是robots協(xié)議?
1.robots.txt是什么?
有沒(méi)有想過(guò),如果我們某個(gè)站點(diǎn)不讓百度和google收錄,那怎么辦?
搜索引擎已經(jīng)和我們達(dá)成一個(gè)約定,如果我們按約定那樣做了,它們就不會(huì)去收錄。這個(gè)寫約定的的文件命名為:robots.txt。robots.txt是一個(gè)最簡(jiǎn)單的.txt文件,用以告訴搜索引擎哪些網(wǎng)頁(yè)可以收錄,哪些不允許收錄。
如果你的站點(diǎn)對(duì)所有搜索引擎公開,則不用做這個(gè)文件或者robots.txt為空就行。
2.Robots.txt文件怎么寫
robots.txt文件的格式:
User-agent:定義搜索引擎的類型
Disallow:定義禁止搜索引擎收錄的地址
Allow:定義允許搜索引擎收錄的地址
一般情況下,robots.txt里只寫著兩個(gè)函數(shù):User-agent和Disallow,至少要有一個(gè)Disallow函數(shù),如果都允許收錄,則寫:Disallow:,如果都不允許收錄,則寫:Disallow:/(注:只是差一個(gè)斜桿)。在文件中只寫出要屏蔽的蜘蛛就可以了,允許爬行的蜘蛛就不用寫出來(lái)了。并且,有幾個(gè)禁止,就得有幾個(gè)Disallow函數(shù),要分行描述。
例1.禁止所有搜索引擎訪問(wèn)網(wǎng)站的任何部分
User-agent:*(注:*是一個(gè)通配符,在這里指所有的搜索引擎種類)
Disallow:/
例2.禁止某個(gè)搜索引擎的訪問(wèn)
User-agent:BadBot
例3.允許某個(gè)搜索引擎的訪問(wèn)
User-agent:Baiduspider
allow:/
例4.容許搜索引擎訪問(wèn)特定目錄中的網(wǎng)頁(yè)
User-agent:*
Allow:/目錄1/目錄2(容許訪問(wèn)目錄2中的網(wǎng)頁(yè))
Allow:/目錄3/目錄4(容許訪問(wèn)目錄4中的網(wǎng)頁(yè))
Allow:/目錄5/目錄6(容許訪問(wèn)目錄6中的網(wǎng)頁(yè))
Disallow:/目錄1/
Disallow:/目錄3/
Disallow:/目錄5/
特別提示:robots里面內(nèi)容的大小寫不可更改,Disallow后面的冒號(hào)必須為英文狀態(tài)的。
3.Robots.txt文件應(yīng)放在哪里?
robots.txt文件必須放在網(wǎng)站的根目錄下,必須命名為:robots.txt,都是小寫,robot后面加"s"。放在子目錄的robots.txt文件搜索引擎不能爬取到,所以不會(huì)起任何作用。
例子:
http://www.cncn.com/robots.txt有效
http://www.cncn.com/bbs/robots.txt無(wú)效
4.生效時(shí)間
robots.txt文件一般生效時(shí)間為7-15天,即1-2周。如果新網(wǎng)站源碼中包含robots.txt文件,那樣蜘蛛進(jìn)行爬行時(shí)就會(huì)生效,如果是后來(lái)添加的,那樣蜘蛛需要對(duì)數(shù)據(jù)進(jìn)行更新,時(shí)間一般在7-15天。
5.關(guān)于robots.txt一般站長(zhǎng)需要注意以下幾點(diǎn):
1.)網(wǎng)站上經(jīng)常存在這種情況:不同的鏈接指向相似的網(wǎng)頁(yè)內(nèi)容。這不符合SEO上講的“網(wǎng)頁(yè)內(nèi)容互異性原則”。采用robots.txt文件可以屏蔽掉次要的鏈接。
2.)網(wǎng)站改版或URL重寫優(yōu)化時(shí)原來(lái)不符合搜索引擎友好的鏈接需要全部屏蔽掉。采用robots.txt文件刪除舊的鏈接符合搜索引擎友好。
3.)一些沒(méi)有關(guān)鍵詞的頁(yè)面,比如站內(nèi)的搜索結(jié)果頁(yè)面屏蔽掉更好
4.)網(wǎng)站中的腳本程序、樣式表等文件即使被蜘蛛收錄,也不會(huì)增加網(wǎng)站的收錄率,還只會(huì)占用服務(wù)器存儲(chǔ)空間。因此必須在robots.txt文件里設(shè)置不要讓搜索蜘蛛索引腳本程序、樣式表等文件。
5.)搜索蜘蛛抓取網(wǎng)頁(yè)太浪費(fèi)服務(wù)器資源,在robots.txt文件中設(shè)置所有的搜索蜘蛛都不能抓取全部的網(wǎng)頁(yè)。如果這樣的話,會(huì)導(dǎo)致整個(gè)網(wǎng)站不能被搜索引擎收錄。
(欣欣旅游網(wǎng):一刀)
第一次去西藏,不懂的路線規(guī)劃,可以問(wèn)我
沒(méi)有電話,咨詢不了,請(qǐng)速聯(lián)系,咨詢密云CS...
謝謝你們的認(rèn)可和支持。歡迎你們以后有時(shí)間...
更多精彩內(nèi)容,請(qǐng)?jiān)L問(wèn):https://www.beijly...
照片沒(méi)有保存下來(lái) 請(qǐng)大家打開自己的小手自己...
你可能不是行業(yè)專家,但你一定有獨(dú)特的觀點(diǎn)和視角,趕緊和業(yè)內(nèi)人士分享吧!
我要投稿
投稿須知
作為行業(yè)領(lǐng)先的旅游商業(yè)和科技媒體,《文旅界》致力于以獨(dú)立的新聞態(tài)度,挖掘和報(bào)道旅游行業(yè)的重要事件,以及影響旅游業(yè)發(fā)展的新趨勢(shì)、新模式和新科技,為旅游業(yè)者提供專業(yè)、及時(shí)、深度的旅游信息服務(wù)。
無(wú)論您是:投放在線廣告、企業(yè)招聘、尋求報(bào)道、還是投稿爆料、加入評(píng)論員,歡迎通過(guò)以下方式聯(lián)系我們:
0592-6532122
wangjing@cncn.net
欣欣旅行社同業(yè)社群招募中,勾搭小編微信號(hào):cncn4021入社群
掃描二維碼分享到微信
分享到
Copyright © 2025 智旅數(shù)文 cncn.net 閩ICP備11015723號(hào)-3