先森用了幾天的VeryCloud、騰訊云兩個云服務商的CDN,時間雖短,卻問題不斷。為了不讓自己忘記這些來之不易的經驗,先森覺得把它們寫出來,記下來。當然能幫上人就更好了。
除了本篇文章,先森之前還寫了一篇總結,有興趣的也可以去看看:
下面,先森來做新一輪的總結。
1.搜索引擎線路解析
什么是搜索引擎線路?
即專為搜索引擎單獨設置的DNS解析線路。
為什么要設置搜索引擎線路?
先森主要是在張戈博客接收到了這么一個理念,搜索引擎蜘蛛也許有一個DNS的解析緩存,對你網站解析的IP會保存一段時間,這個時間大概一兩天。而我們使用的CDN是讓訪客訪問就近的服務器節點,每個節點都有單獨的IP,而且這個IP還不是長時間保留的。這就相當于我們的網站經常更換服務器,這樣我們自己都會感覺不好吧,何況是蜘蛛?
同時,我們的網站設置CDN后,搜索引擎蜘蛛訪問的也是節點IP,而一旦蜘蛛對這個IP進行緩存,緩存時間大于CDN的IP存在時間的時候,蜘蛛就訪問不了這個IP了。那么蜘蛛就會判定我們的網站存在問題,最終導致SEO受到傷害。
大概就是這么一個觀點,詳細的內容還請大家去看看張戈博客的原文:
而解決或者說不產生上面的問題的方法,就是設置搜索引擎線路。雖然張戈已經說得很清楚了,如何設置搜索引擎線路,但還是有很多站長在問設置問題。包括先森自己,也是研究了一下,才想明白該如何設置。
首先,奉勸和我之前一樣,一直使用萬網域名解析的,趕緊換換吧。下面再次簡單講講先森的經歷。
萬網解析只支持百度、谷歌、必應三家的搜索引擎線路,重點是解析的還不準確。不,是非常不準確。先森用百度抓取診斷,該抓取CDN節點IP的還是抓取,設置和沒設置完全沒有什么兩樣。

萬網設置搜索引擎線路后的百度抓取診斷

百度抓取的IP實為騰訊云的CDN節點IP
問張戈博客的張哥,張哥給我兩個解決辦法,一是換DNSPod解析,二是使用百度云加速,因為云加速有自動的搜索引擎回源。
先森因為才開始使用VeryCloud不久,還想再研究研究,就選擇了使用DNSPod的方法。關于如何將域名解析從萬網轉移到DNSPod,先森也分享過方法,因為DNSPod的方法有點老舊了:
如何設置搜索引擎線路?
首先新增一個解析記錄,然后開始設置。
主機記錄:根據需求,如果直接解析域名,填“@”;域名、二級域名都要解析,填“*”;只解析一個二級域名,填二級域名的值,如“www”。先森就只解析www的。
記錄類型:選擇A記錄。
線路類型:DNSPod支持百度、谷歌、必應、搜搜、搜狗、奇虎,和相當于默認搜索引擎線路的“搜索引擎”。先森是每個搜索引擎線路都單獨設置了一條A記錄。
記錄值:這里就設置自己源站服務器IP,即真實IP,要小心,不要泄露。
其他各項就根據自己的需求設置了。下面貼出先森的設置情況:

DNSPod搜索引擎線路設置
設置之后,先森立馬到百度站長工具去抓取診斷,秒秒鐘虐了萬網:

抓取IP為源站IP
2.詳讀“常見問題”
這一點,就是讓大家去仔仔細細的將VeryCloud、騰訊云的“常見問題”看完,這樣能使我們少走很多彎路。這也是先森在問了售后很多問題之后發現的,有很多問題,都已經寫入“常見問題”中了,相信售后的心是崩潰的。
其實說到底,就是多讀、多看、多想。
兩個CDN服務商都有常見問題頁面,但是先森覺得VeryCloud的常見問題比較偏原理解釋,重點介紹了什么是CDN、CDN如何工作、CDN的優勢、什么是緩存命中率等等:

VeryCloud常見問題
其實VeryCloud的話,大家更應該點擊上圖紅框中的云分發,看更多更有針對性的解決問題方法。單頁不能忽視這一頁15個常見問題的作用,這些基礎知識能讓我們對CDN更加了解。更多詳情就希望大家自己查看了:
而騰訊云的常見問題頁面,則做的更加細致,問題更加全面,也有著很好的針對性。騰訊云對自家服務進行了介紹,其中有優勢,有原理,有功能。從基礎介紹,接入相關,日常使用,問題排查四個方面回答問題,顯得簡單明了。其中就有如何判斷用戶訪問是否命中CDN cache、接入cdn之后網站打不開,如何排查、命中率低是什么原因呢等經典問題,這些問題有很多都是現在自己搞了很久才弄明白的,沒想到這里就很清楚的寫著:

騰訊云常見問題
在這里,先森也把騰訊云的相關鏈接貼出來,騰訊云還有一個內容分發網絡的幫助文檔,文檔中包含以上內容,查看卻沒有以上內容方便,但先森還是一并貼出來:
騰訊云還介紹了一個可以管理查看CDN中緩存文件軟件SVN的使用方法,但是騰訊云卻沒有使用SVN源了,讓我們使用他們的對象儲存業務COS。
3.查看日志
不管是VeryCloud還是騰訊云,都支持查看日志。但是他們的日志下載之后,打開顯得非常凌亂,雖然很詳細,但遠不如直接在網站上查看統計分析來的簡單明了。主要還是,關于CDN日志,他們都沒有提供什么統計分析軟件。
不過先森覺得,查看日志主要也是排查問題的,很具有針對性。簡單的來說,騰訊云統計里可以看到訪問返回碼,我們可以看到產生了多少次的404,但是看不到是哪些頁面出現了404,這時候就需要查看日志了。
先森問了騰訊云的售后,售后推薦使用notepad++,sublime兩款軟件。日志的內容顯得很亂,但都是每行一條,每條里面有很多數據,這些數據是按照順序來的。
VeryCloud日志:
例:12.243.121.90 - - [24/Mar/2015:12:42:18 +0800] "GET http://www.verycloud.cn/usr/uploads/201503/20150302100356_29670.flv HTTP/1.1" 200 1933334 "http://portal.verycloud.cn/galileo/20150306/8ad1637dbf7cd191f1fe728fc18658d9.swf" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36" TCP_MEM_HIT 0.947 58.22.102.229
| 字段 | 參數 |
| 客戶端真實ip | 12.243.121.90 |
| 請求時間 | 24/Mar/2015:12:42:18 |
| 方法 | GET |
| URL | |
| httpversion | HTTP/1.1 |
| 狀態碼 | 200 |
請求字節 | 1933334 |
| Referer | http://portal.verycloud.cn/galileo/20150306/8ad1637dbf7cd191f1fe728fc18658d9.swf |
| UA | Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36 |
| 結果 | TCP_MEM_HIT |
| 處理請求時間 | 0.947 |
| 節點IP | 58.22.102.229 |
騰訊云日志:
拿先森自己網站的日志中的一行作為例子:
20160407104007 180.97.171.210 www.cnidcc.cn /qzcdnhcjszjrtxy.html 12276 120 2 200 NULL 1 "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0"
| 字段 | 參數 |
| 請求時間 | 20160407104007 |
| 訪問域名的客戶端IP | 180.97.171.210 |
| 被訪問域名 | www.cnidcc.cn |
| 文件請求路徑 | /qzcdnhcjszjrtxy.html |
| 本次訪問字節數大小 | 12276 |
| 省份 | 120 |
| 運營商 | 2 |
| http返回碼 | 200 |
| referer信息 | NULL |
| request-time(毫秒) | 1 |
| User-Agent | "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:45.0) Gecko/20100101 Firefox/45.0" |
關于省份和運營商代碼所代表的含義,還需要我們去查看騰訊云的映射表
注:Referer信息,保存的是訪問該網頁是從哪個頁面鏈接過來的,我們統計搜索引擎跳轉,就是用的這個信息。
4.文件刷新
使用CDN有一個很大的問題,就是動態數據的顯示問題。最容易涉及到的,就是文章的訪問量,以及最新評論的問題。
關于訪問量,無傷大雅,只要設置緩存策略的時候緩存時間設短一些就還好。至于文章的最新評論,就有點不好了。別人在你的網站上留了言,明明通過審核了,卻還是顯示之前的頁面,最新的評論就沒有顯示出來。這時候我們再去手動的刷新緩存的話,就會比較麻煩。所以,我們就需要用到刷新緩存的API了。
我們使用API,實現當頁面增加了評論的時候,刷新該頁面。具體的使用方法是將一些代碼放入WordPress主題functions.php文件中即可,代碼是張戈博客提供的,需要的小伙伴可以去看看:
另外,VeryCloud的API,是不對外開放的,向售后工程師申請的時候,也要保證自己網站帶寬夠大,才能申請成功。售后工程師給先森的回復是要達到20M的帶寬,這對張戈博客當然不成問題,但是對我們這些小站來說,差的太遠。
雖然有小伙伴在先森交《全站CDN緩存加速之接入VeryCloud》一文中回復說,VeryCloud開放了API接口,但先森查看之后發現,實際還是需要讓你想客服索要API。
總結
回顧一下,本文主要介紹了如何設置搜索引擎解析線路,通過詳讀“常見問題”來少走彎路,如何查看VeryCloud的日志,日志內容的參數含義,以及如何用API接口來實現刷新緩存。
現在就總結這些,如果以后還有什么好的經驗,先森還會默默的更新的。
歷史上的今天:
- 2022: 使用python破解電信寬帶密碼(5)
轉載請注明出處來自http://www.cnidcc.cn/vc_txycdnsyjqzjzyxjy.html

川公網安備 51011202000104號