搜索引擎蜘蛛工作原理
搜索引擎蜘蛛是通過鏈接地址來尋找網頁的。
網站優化
搜索引擎蜘蛛名稱隨搜索引擎的不同而不同。那它的原理是由一個起始鏈接開始抓取網頁內容,同時也采集網頁上的鏈接,并將這些鏈接作為它下一步抓取的鏈接地址,如此循環,直到達到某個停止條件后才會停止。停止條件的設定通常是以時間或是數量為依據,可以通過鏈接的層數來限制網絡蜘蛛的爬取。
同時頁面信息的重要性為客觀因素決定了蜘蛛對該網站頁面的檢索。站長工具中的搜索引擎蜘蛛模擬器其實它就是這個原理。基于這蜘蛛工作原理,站長都會不自然的增加頁面關鍵詞出現次數,雖然對密度產生量的變化,但對蜘蛛而言并沒達到一定的變化。這在搜索引擎優化過程中應該要避免的。影響因素
由國外37名優秀的SEO界高手共同參與,以投票形式評論影響Google排名的重要因素,此次評選非常有價值,盡管沒有將200多個Google排名因素全部列出,但Google排名算法中90%-95%的重要成分已經包含在其中了。正面因素
排名 得分 分類 詳細說明
1 關鍵詞
(1)關鍵詞在網站TITLE上的使用
(2)關鍵詞在網頁內容上的應用
(3) 頁面內容和關鍵詞的相關性(語義分析)
(4) 關鍵詞在H1標簽中的使用
(5) 關鍵詞在網站域名中的使用
(6) 關鍵詞在頁面URL中的使用
(7) 關鍵詞在H2、H3等Headline標簽中的使用
(8) 圖片的關鍵詞優化
(9) 關鍵詞在Meta Description中的使用
(10) 關鍵詞在Meta Keywords中的使用
2 外部鏈接
(1)外部鏈接的錨文字
(2) 外部鏈接頁面本身的鏈接流行度
(3) 外部鏈接頁面的主題性
(4) 外部鏈接頁面在相關主題的網站社區中的鏈接流行度
(5) 鏈接的年齡
(6) 鏈接的周圍文字
(7) 同域名下外部鏈接頁面的鏈接流行度
(8) 外部鏈接的創建和更新時間
(9)外部鏈接網站域名的特殊性
(10) 外部鏈接網站的PR值
3 網站品質
(1) 網站的外部鏈接流行度、廣泛度
(2) 域名年齡(從被搜索引擎索引開始計算)
(3) 網站的外部鏈接頁面內容與關鍵詞的相關性
(4)網站在主題相關的網站群中的鏈接流行度
(5) 網站新外部鏈接產生的速率
(6) 網站收錄數量
(7) 用戶查詢的關鍵詞與網站主題的相關性(防止Google bombing)
(8) 用戶行為
(9) Google的人工授予權重
(10) 域名的特殊性(.edu .gov等)
(11) 新頁面產生的速率
(12) 用戶搜索網站的次數
(13) 網站是否通過Google Webmaster Central的認證
4 頁面質量
(1)網站內部鏈接結構
(2) 導出鏈接的質量和相關性
(3) 頁面的年齡
(4) 頁面內容的質量
(5) 網站的結構層次
(6) URL中“/”符號的出現次數
(7) 拼寫和語法的正確性
(8) HTML代碼是否通過W3C認證
5 權重標簽 strongheading標簽在頁面內容中的使用
6 nofllow標簽nofollow標簽在頁面鏈接及meta中的使用。
7 針對百度的SEO優化負面因素
排名 得分 詳細說明
1、服務器經常無法響應;
2 、與Google已經收錄的內容高度重復;
3 、鏈向低質量或垃圾站點;
4 、網站大量頁面存在重復的META標簽;
5 、過分堆砌關鍵詞;
6 、參與鏈接工廠或大量出售鏈接;
7 、服務器響應時間非常慢;
8 、網頁主要META更改頻率過高;
9 、非常低的流量,用戶行為反映差;
10、SEO優化中關鍵詞布局技巧
把頁分成小組
H1(由主要關鍵詞組成) 在每頁唯一使用的一個H1標簽
H2(相似的分題重復主要關鍵詞短語)段落
H2(另外的一個次要主題用一些相似或重疊的變種關鍵詞))段落
H2(有時一些分標題沒有關鍵詞,但是大多數也做成H2的標題)段落
STRONG標簽用于站長們文章內容的關鍵詞突出顯示
通常副標題將會把重心集中在一個些較長的關鍵詞短語,特別要超過主標題,但是也將會包含一些與主標題相同的詞組。另外描寫的副標題也要改進站長們的網站的瀏覽效率和可用性。
建議每頁使用一個H1標簽,用其他的字組文本輔助關鍵詞構成那標題標簽中的信息。
關鍵詞的提取
大部分的網站以HTML格式存在,對于索引來說,只需要處理文本信息。因此需要把網頁中內容提取出來,再過濾一些腳本如JS等以廣告形式存在的內容,同時記錄文本的版面格式信息,網頁處理主要包括4個方面:關鍵詞的提取,重復,轉載的消除,鏈接分析,和網頁重要度計算,關鍵詞是怎么提取的,由于HTML 網頁來源多樣性,內容比較隨意,新人SEO且不講究規范,工整,包含了許多無關的信息,中文網頁用到了詞典和切詞軟件,不應該在文本中出等詞,稱為停用詞,有效詞語要保證在200左右。
與關鍵詞有關的頁面排名因素1.標題標簽中第一個字或者詞使用關鍵詞
2.域名中含有關鍵詞
3.H 1標簽使用了關鍵詞
4.頁面上導出內部鏈接錨文字中使用了關鍵詞
5.頁面上導出外部鏈接錨文字中使用了關鍵詞
6.頁面前50-100個可見文字中使用了關鍵詞
7.子域名中包含關鍵詞
8.目錄名中還有關鍵詞
9.其他正文標題(H2、H3)中使用了關鍵詞常見術語
鏈接場(Link Farm)
在 SEO 術語中,鏈接場是指一個充滿鏈接的頁面,這些鏈接其實沒有實際作用,它們只作為鏈接存在,而沒有任何實際的上下文。那些采用運用黑帽 SEO 方法的人利用鏈接場,在一個頁面中增加大量鏈接,希望能通過這種方式使 Google 誤認為這個頁面很有鏈接的價值。
交互鏈接(Reciprocal Link)
也稱作雙向鏈接,是對一個網頁不光有超文本鏈接,同時對應有和原始網頁的鏈接。
有機列表(Organic Listing)
有機列表是 SERP 中的免費列表。有機列表的 SEO 通常涉及改進 Web 站點的實際內容,這往往是在頁面或基礎架構級別進行的。
PageRank
PageRank是迷戀Google的人們用來測試其站點在 Google 中的排名的一種度量標準。SEO 和搜索引擎營銷(SEM)專家也使用這個術語描述網頁在 SERP 中的排名以及 Google 根據排名算法給予站點的分數。無論如何定義,PageRank 都是 SEO 的重要部分。
付費列表(Paid Listing)
顧名思義,付費列表就是只有在付費后才能列入搜索引擎的服務。根據搜索引擎的不同,付費列表可能意味著:為包含于索引之中、每次點擊(PPC)、贊助商鏈接(Sponsored Link)或者在搜索目標關鍵詞和短語時讓站點出 SERP 中的其他方式而付費。
永久重定向(Permanent Redirect)
也被稱為301 重定向,是一條對網站瀏覽器的指令來顯示瀏覽器被要求顯示的不同的URL,當一個網頁經歷過其URL 的最后一次變化以后時使用。一個永久定向是一種服務器端的重定向,能夠被搜索引擎蜘蛛適當地處理。
排名(Ranking)
排名是頁面在目標關鍵詞的SERP中列出的位置。SEO 的目標是提高 Web 頁面針對目標關鍵詞的排名。
排名算法(Ranking Algorithm)
排名算法是搜索引擎用來對其索引中的列表進行評估和排名的規則。排名算法決定哪些結果是與特定查詢相關的。
搜索引擎營銷(Search Engine Marketing,SEM)
SEM 這個術語可以與 SEO 互換使用,但 SEM 常常是指通過付費和廣告向搜索引擎推銷 Web 站點,同時應用 SEO 技術。
搜索引擎優化(Search Engine Optimization,SEO)
SEO 就是根據對搜索引擎的吸引力和可見性來優化內容,從而使 Web 頁面能夠被搜索引擎選中。SEO 主要用來提高有機列表的排名。
搜索引擎結果頁面(Search Engine Results Page,SERP)
SERP 是為特定搜索顯示的列表或結果。SERP 有時候定義為搜索引擎結果的安排(placement)。根據本系列的目的,我將其稱為頁面而不是安排。在SEO領域中,在SERP中取得良好的表現就是一切。
垃圾技術(Spamming)
垃圾技術是一種欺詐性的SEO手段,它嘗試欺騙爬行器(Spider),并利用排名算法中的漏洞來影響針對目標關鍵詞的排名。垃圾技術可以表現為多種形式,但是 “垃圾技術” 最簡單的定義是 Web 站點用來偽裝自己并影響排名的任何技術。
關鍵字隱密字 (Hidden Text With Keyword Stuffing)
是另外一欺騙搜索引擎的做法。通常是指設置關鍵字的顏色和網頁背景顏色一樣,或通過 CSS Hidden Attribute (隱密特性) 來達到優化效果。這種做法一旦被Google發現,遭遇也會是該站點從Google的數據庫中除名。
爬行器(Spider)
爬行器在 Web 上漫游,尋找要添加進搜索引擎索引中的列表。爬行器有時也稱為 Web 爬行榜(Webcrawler)或機器人。針對有機列表優化頁面也就是為了吸引爬行器的注意。
在SEO中過多使用flash和Ajax技術,會給搜索引擎帶來很多麻煩,搜索引擎還不能很好地索引由flash、ajax表現的網頁,原因就是搜索引擎只索引頁面,而不會索引應用程序。
還有即使搜索引擎做到了完全解釋Flash文件或者ajax應用程序,并能分析和索引它們的相關內容,也還是沒有任何辦法使用url導航應用程序,對排名沒有一點幫助。搜索引擎的主要目標的是將搜索結果提交給用戶,但當處理這些媒體信息時,搜索引擎將無法排列這些信息的順序。Flash和Ajax將會帶來更多有創意的設計,也會帶來更難偵測的垃圾網站形式。
谷歌索引的Flash,給的建議就是,網站設計者應該僅在需要使用Flash和 Ajax的地方使用它,應該主要還是多使用HTML語言設計網站,而將Flash和Ajax作為輔助技術,為用戶提供切實的好處。通常,HTML和 JavaScript的混合也基本可以達到使用這些技術的效果。也就是說,在使用Flash和Ajax時應把它們當成頁面上的單元,而不是頁面本身。
Link Popularity 網站的鏈接廣泛度。
在搜索引擎排名中的作用已得到廣泛的認同和重視。即使站長們沒有在GOOGLE上提交站長們的站點,但與其它網站作了鏈接,Google也可能收錄站長們的網站。搜索引擎還可能完全依據站長們的鏈接廣泛度決定站長們的網站排名。
Internal Links 內部鏈接:本網站內部網頁之間的鏈接
External Links外部鏈接:本網站外部的鏈接,一般是指其他網站連到本網站的鏈接
Backward Links或Incoming/Inbound Links反向/導入鏈接:意義與“外部鏈接”接近,指其他網站連到本網站的鏈接
Outgoing/Outbound Links導出鏈接:指從本網站連到其他網站的鏈接
Search Engine Positioning 搜索引擎定位
Search Engine Ranking 搜索引擎排名
External Files外部文件存儲
把JavaScript文件和CSS文件分別放在JS和CSS外部文件中。這樣做的好處是把重要的頁面內容放到頁面頂部,同時能縮小文件大小。有利于搜索引擎快速準確地抓取頁面重要內容。
Keyword Density 關鍵詞密度
ROBOTS 搜索機器人
Affiliate Marketing 聯屬網絡營銷(會員制營銷、網站聯盟等)
聯屬網絡營銷 指的是一種網站A為網站B放置廣告按鈕,然后從為網站B帶來的銷售額中獲得回傭的一種廣告系統。某些廣告主通過這種方式獲得市場信息而不是現金銷售。這種方式被營銷費用比較緊張的新網站采用得比較普遍。
Cost-Per-Click (簡稱CPC)按點擊數付費
聯屬網絡營銷管理系統記錄每個客人在聯屬會員網站上點擊到商家網站的文字的或者圖片的鏈接(或者Email鏈接)次數,商家(Merchant)按每個點擊多少錢的方式支付廣告費。
Cost-Per-Lead (簡稱CPL)或Cost-Per-Acquisition (簡稱CPA)
按引導數付費或訪問者通過聯屬會員的鏈接進入商家網站后,如果填寫并提交了某個表單,管理系統就會產生一個對應給這個聯屬會員的引導(Lead)記錄,商家按引導記錄數給會員付費。
Cost-Per-Sale (簡稱CPS) 按銷售額付費
商家只在聯屬會員的鏈接介紹的客人在商家網站上產生了實際的購買行為后(大多數是在線支付)才給聯屬會員付費,一般是設定一個傭金比例(銷售額的10%到50%不等)。
Pay For Performance (按效果付費)
聯屬營銷按效果付費的營銷方式無論對于商家還是聯屬會員都是比較容易接受的。由于網站的自動化流程越來越完善,在線支付系統也越來越成熟,越來越多的聯屬網絡營銷系統采用按銷售額付費的方法。由于這種方法對商家來說是一種零風險的廣告分銷方式,商家也愿意設定比較高的傭金比例,這樣就使得這種方式的營銷系統被越來越多地采用。
Open Directory Project (簡稱ODP) 目錄索引
Full Text Search Engine 全文搜索引擎
Search Index/Directory 目錄索引類搜索引擎
META Search Engine 元搜索引擎
Spider 俗稱“蜘蛛”
Indexer 檢索程序
Free For All Links (簡稱FFA)免費鏈接列表
Stop Words/Filter Words 停用詞/過濾詞
這兩者意義一樣,都是指一些太常用以至沒有任何檢索價值的單詞,搜索引擎碰到這些詞時一般都會過濾掉。因此為節省空間,應盡量避免使用這一類的詞,尤其是在對文字數量有嚴格限制的地方。
Spam:搜索引擎垃圾技術的統稱
Frame Sets 框架結構
有些搜索引擎(如FAST)是不支持框架結構的,他們的“蜘蛛”程序無法閱讀這樣的網頁。
Image Maps 圖象區塊
當“蜘蛛”程序遇到這種結構時,往往會感到茫然不知所措。因此盡量不要設置Image Map鏈接。
Dynamic Pages 動態網頁
通過程序和數據庫連接制作的網頁,任何地址中帶“?”號、“&”號(及其他類似符號)的網頁都會把“蜘蛛”程序擋在門外。
Invisable/hidden text 隱藏文本內容
意欲在不影響網站美觀的前提下通過包含大量關鍵詞的網頁提高關鍵詞相關性得分,從而達到改善搜索引擎排名的目的。
Invisable/hidden links 隱藏鏈接
意欲在不影響網站美觀的前提下通過在其它頁面添加指向目標優化頁的隱形鏈接,通過提升鏈接得分而改善搜索引擎排名。
Misleading Words 誤導性關鍵詞
在頁面中使用與該網頁毫不相干的誤導性關鍵詞來吸引查詢該主題的訪問者訪問網站。這種做法嚴重影響了搜索引擎所提供結果的相關性和客觀性,為搜索引擎所深惡痛絕。
Repeated Words 重復性關鍵詞
這種作弊技術也被稱為“關鍵詞堆砌欺騙(Keyword Stuffing)”,
網站優化
它利用搜索引擎對網頁正文和標題中出現的關鍵詞的高度關注來對關鍵詞進行不合理的(過度)重復。類似的其它做法還包括在HTML元標識中大量堆砌關鍵字或使用多個關鍵字元標識來提高關鍵詞的相關性。這種技術很容易被搜索引擎察覺并受到相應懲罰。
Keyword Stuffing 關鍵詞堆砌
Cloaked Page 隱形頁面
對實際訪問者或搜索引擎任一方隱藏真實網站內容,以向搜索引擎提供非真實的搜索引擎友好的內容提升排名。
Deceptive redirects 欺騙性重定向
指把用戶訪問的第一個頁面(著陸頁)迅速重定向至一個內容完全不同的頁面。
Shadow Domain 鬼域
這是最常見的欺騙性重定向技術,通過欺騙性重定向使用戶訪問另外一個網站或頁面。
Meta Refresh刷新標識
Doorway Page 門頁
也叫“Bridge/Portal/Jump/Entry Page”。是為某些關鍵字特別制作的頁面,專為搜索引擎設計,目的是提高特定關鍵詞在搜索引擎中的排名所設計的富含目標關鍵詞的域名,且重定向至另一域名的真實網站。搜索引擎的Spiders往往忽略對那些自動重定向到其它頁的頁面的檢索。
Mirror Sites鏡象站點
通過復制網站或網頁的內容并分配以不同域名和服務器,以此欺騙搜索引擎對同一站點或同一頁面進行多次索引。大多數搜索引擎都提供有能夠檢測鏡象站點的適當的過濾系統,一旦發覺鏡象站點,則源站點和鏡象站點都會被從索引數據庫中刪除。
Link Spamming 作弊鏈接/惡意鏈接
link farms 鏈接工廠
Bulk Link Exchange Programs大宗鏈接交換程序
Cross Link交叉鏈接
Doorway Domain 門域
專為提高特定關鍵詞在搜索引擎中的排名所設計的富含目標關鍵詞的域名,然后重定向至其它域名的主頁。由于搜索引擎一般忽略自動重定向至其它頁的頁面的檢索,所以不提倡使用這種技術。
作為一家互聯網公司的產品經理,針對排名SEO優化,我可以給出以下建議:
1. 關鍵詞研究:我們需要進行關鍵詞研究,找到與產品相關的高搜索量和低競爭度的關鍵詞。這將有助于提高我們網站在搜索引擎結果頁面(SERP)中的排名。
2. 網站優化:確保網站的技術方面是優化的,包括網站速度、網頁結構和標簽的正確使用等。這可以提高網站的用戶體驗和搜索引擎的爬行效率。
3. 內容優化:制作高質量的內容對于排名SEO至關重要。我們需要為關鍵詞創建有關產品的優質內容,并確保內容的相關性、獨特性和知識性。確保內容易于閱讀和理解,可以吸引用戶留在我們的網站上。
4. 外部鏈接建設:獲取來自高質量和相關性強的其他網站的外部鏈接(Backlinks),可以提高我們網站的權威性和排名。我們可以通過合作、媒體宣傳、社交媒體等方式來增加外部鏈接。
5. 用戶體驗優化:搜索引擎越來越注重用戶體驗。我們需要確保網站易于導航、頁面加載速度快,并提供良好的交互體驗。這將有助于提高網站的排名。
6. 數據分析與調整:使用工具來跟蹤關鍵指標,如流量來源、頁面瀏覽量和轉化率等。根據數據分析的結果,我們可以調整和優化我們的SEO策略,以達到更好的排名效果。
SEO是一個長期的過程,而不是一蹴而就的。我們需要持續關注并優化我們的SEO策略,以適應不斷變化的搜索引擎算法和用戶需求。
SEO 優化大致包含4個方向,內部結構優化、內容優化、內鏈優化、外鏈優化。
一、內部結構優化
1.TDK優化:這里的TDK并不止首頁,還有欄目頁和文章頁的TDK,這就是為什么建站的時候選擇可以自定義標簽的原因。T即title,網站的標題,很!重!要!如果TDK滿分10分,T要占到7分左右,標題是蜘蛛過來第一個看的東西,即第一印象,標題必須包含關鍵詞,即網站的功能,網站是做什么產品或是服務的,語句通順,不要堆砌關鍵詞。D即description,網站描述,是對標題的補充。K即keywords,欄目頁和文章頁的TDK在后臺具體欄目的高級設置里可以找到。
2.301重定向和404報錯頁面的制作,必須要有,沒什么可說的。
3.層級目錄:即打開一個頁面要多少層級,這個很多網站都忽略,建議在三級以內,減少蜘蛛爬取需要的時間。
4.關鍵詞布局及密度:根據用戶瀏覽頁面點擊的熱力圖發現的點擊熱區,進而將關鍵詞部署到相應地方。即F布局,一個頁面內的關鍵詞密度保持在2%-8%之內,這個只是個經驗數據,不一定準確。
5.四處一詞:TDK+尾部或錨文本。
6.網站導航:即主導航、次導航和面包屑導航,包含關鍵詞、突出重點、使用純文字,要和相應TDK保持一致。
二、內容優化
主要是文章的質量要高,即使不是純原創,至少也要是高度偽原創,偽原創要選取未收錄的或者屏蔽了搜索引擎的網站上的文章,或者是翻譯過來的文章,只要是你第一個發的文章,蜘蛛就認為是原創。
三、內鏈優化
總結起來就是增加站內的鏈接密度,就像蜘蛛網一樣,越密集越好,最常見的就是首頁、欄目和文章頁的相互跳轉;LOGO的鏈接,文章頁使用TAG標簽和上、下一篇或相關文章,增加頁面間的鏈接數和相關度。
四、 外鏈優化
一個原則就是內容相關、循序漸進,很多人為了迅速增加外鏈,瘋狂添加,但是權重升不上來的原因就在此。外鏈的主要方法就是增加友情鏈接,但是要考察增加的友鏈質量度,包括PR值,是否有nofollow等標簽,正常網站的友鏈數在30個左右,如果你添加友鏈的網站有超過50個友鏈,那并不會對你的網站有多少價值,相反還可能把你的權重更多的分給他。除了友鏈,增加論壇、新聞、博客、SNS、軟文的相關鏈接也是增加網站外鏈的一種。
最后不得不說的一點是,SEO優化是一個漫長的過程,切勿操之過及。
seo優化如何做?以下為大家介紹十個技巧。
一、熟知搜索引擎工作原理:
網站優化之前,我們一定要清楚搜索引擎的工作原理,畢竟SEO是針對搜索引擎操作的,搜索引擎一般由下面幾個模塊組成:
1:抓抓取模塊
2:過濾模塊
3:收錄模塊
4、排序模塊。
學懂這幾個模塊的SEO技術,搜索引擎的工作原理遇到一些問題的時候就可以知道問題的產生原因了。
二、學習SEO名詞大全
作為一個SEO人常見的名詞是必須熟知的,在后面的文章中,我們將會不斷更新SEO名詞解釋的文章更新。
三、選擇利于優化的域名和空間
要想優化好一個網站,從網站的初期就要做好各項優化準備,包括域名和空間相關的知識。
四、SEO常用工具
想要學好SEO,一些常用的SEO工具也要了解,比如站長工具,SEO綜合查詢,百度權重查詢,關鍵詞的挖掘,搜索引擎蜘蛛、機器人模擬工具,百度站長平臺等等。SEO常用工具的使用方式也要掌握。
五、做好移動適配
我們做好一個網站以后,為了提升用戶的移動搜索結果瀏覽體驗,一定要做好移動適配功能。
六、提交鏈接
還要注意提交想被百度收錄的鏈接,百度搜索引擎會按標準處理,進行收錄,要注意的是,百度不一定會收錄我們所提交的鏈接。
七、網站優化的操作
在網站優化的操作中有哪些需要做好的基礎工作呢?下面列舉幾個點:
1、戰略的制定:通過數據分析用戶需求和競爭對手,找出SEO優化的突破口。
2、關鍵詞挖掘:根據用戶需求和SEO優化的突破口進行關鍵詞挖掘。
3、網站搭建:按照戰略目標,有計劃的制定網站建設框架,網站搭建分為幾個步驟:導航設計、頁面框架、確定草圖、設計設置展示。網站搭建之后就可以根據我們之前設計的框架對導航、首頁、目錄頁、內頁的標題和url進行設置了,同時也可以根據內容框架開始給網站填充內容。
八、對關鍵詞進行挖掘
那么接下來的工作就是對關鍵詞進行挖掘,下面介紹一些常見的關鍵詞挖掘工具:
1:百度下拉框
2:百度相關搜索
3:百度指數
4:百度推廣助手
5:行業問答平臺等等。
九、站內優化
以下是SEO優化前期需要做的一些工作:
1:內容更新
2:列出內容大綱
3:優化標題:
4、完善內容。十、站外推廣優化
接下來就是發高質量外鏈。還有進行營銷推廣工作。營銷推廣工作包括QQ營銷、百度文庫營銷、百度知道營銷、還有百度貼吧營銷、博客營銷等等。
搜索引擎蜘蛛工作原理
搜索引擎蜘蛛是通過鏈接地址來尋找網頁的。
網站優化
搜索引擎蜘蛛名稱隨搜索引擎的不同而不同。那它的原理是由一個起始鏈接開始抓取網頁內容,同時也采集網頁上的鏈接,并將這些鏈接作為它下一步抓取的鏈接地址,如此循環,直到達到某個停止條件后才會停止。停止條件的設定通常是以時間或是數量為依據,可以通過鏈接的層數來限制網絡蜘蛛的爬取。
同時頁面信息的重要性為客觀因素決定了蜘蛛對該網站頁面的檢索。站長工具中的搜索引擎蜘蛛模擬器其實它就是這個原理。基于這蜘蛛工作原理,站長都會不自然的增加頁面關鍵詞出現次數,雖然對密度產生量的變化,但對蜘蛛而言并沒達到一定的變化。這在搜索引擎優化過程中應該要避免的。影響因素
由國外37名優秀的SEO界高手共同參與,以投票形式評論影響Google排名的重要因素,此次評選非常有價值,盡管沒有將200多個Google排名因素全部列出,但Google排名算法中90%-95%的重要成分已經包含在其中了。正面因素
排名 得分 分類 詳細說明
1 關鍵詞
(1)關鍵詞在網站TITLE上的使用
(2)關鍵詞在網頁內容上的應用
(3) 頁面內容和關鍵詞的相關性(語義分析)
(4) 關鍵詞在H1標簽中的使用
(5) 關鍵詞在網站域名中的使用
(6) 關鍵詞在頁面URL中的使用
(7) 關鍵詞在H2、H3等Headline標簽中的使用
(8) 圖片的關鍵詞優化
(9) 關鍵詞在Meta Description中的使用
(10) 關鍵詞在Meta Keywords中的使用
2 外部鏈接
(1)外部鏈接的錨文字
(2) 外部鏈接頁面本身的鏈接流行度
(3) 外部鏈接頁面的主題性
(4) 外部鏈接頁面在相關主題的網站社區中的鏈接流行度
(5) 鏈接的年齡
(6) 鏈接的周圍文字
(7) 同域名下外部鏈接頁面的鏈接流行度
(8) 外部鏈接的創建和更新時間
(9)外部鏈接網站域名的特殊性
(10) 外部鏈接網站的PR值
3 網站品質
(1) 網站的外部鏈接流行度、廣泛度
(2) 域名年齡(從被搜索引擎索引開始計算)
(3) 網站的外部鏈接頁面內容與關鍵詞的相關性
(4)網站在主題相關的網站群中的鏈接流行度
(5) 網站新外部鏈接產生的速率
(6) 網站收錄數量
(7) 用戶查詢的關鍵詞與網站主題的相關性(防止Google bombing)
(8) 用戶行為
(9) Google的人工授予權重
(10) 域名的特殊性(.edu .gov等)
(11) 新頁面產生的速率
(12) 用戶搜索網站的次數
(13) 網站是否通過Google Webmaster Central的認證
4 頁面質量
(1)網站內部鏈接結構
(2) 導出鏈接的質量和相關性
(3) 頁面的年齡
(4) 頁面內容的質量
(5) 網站的結構層次
(6) URL中“/”符號的出現次數
(7) 拼寫和語法的正確性
(8) HTML代碼是否通過W3C認證
5 權重標簽 strongheading標簽在頁面內容中的使用
6 nofllow標簽nofollow標簽在頁面鏈接及meta中的使用。
7 針對百度的SEO優化負面因素
排名 得分 詳細說明
1、服務器經常無法響應;
2 、與Google已經收錄的內容高度重復;
3 、鏈向低質量或垃圾站點;
4 、網站大量頁面存在重復的META標簽;
5 、過分堆砌關鍵詞;
6 、參與鏈接工廠或大量出售鏈接;
7 、服務器響應時間非常慢;
8 、網頁主要META更改頻率過高;
9 、非常低的流量,用戶行為反映差;
10、SEO優化中關鍵詞布局技巧
把頁分成小組
H1(由主要關鍵詞組成) 在每頁唯一使用的一個H1標簽
H2(相似的分題重復主要關鍵詞短語)段落
H2(另外的一個次要主題用一些相似或重疊的變種關鍵詞))段落
H2(有時一些分標題沒有關鍵詞,但是大多數也做成H2的標題)段落
STRONG標簽用于站長們文章內容的關鍵詞突出顯示
通常副標題將會把重心集中在一個些較長的關鍵詞短語,特別要超過主標題,但是也將會包含一些與主標題相同的詞組。另外描寫的副標題也要改進站長們的網站的瀏覽效率和可用性。
建議每頁使用一個H1標簽,用其他的字組文本輔助關鍵詞構成那標題標簽中的信息。
關鍵詞的提取
大部分的網站以HTML格式存在,對于索引來說,只需要處理文本信息。因此需要把網頁中內容提取出來,再過濾一些腳本如JS等以廣告形式存在的內容,同時記錄文本的版面格式信息,網頁處理主要包括4個方面:關鍵詞的提取,重復,轉載的消除,鏈接分析,和網頁重要度計算,關鍵詞是怎么提取的,由于HTML 網頁來源多樣性,內容比較隨意,新人SEO且不講究規范,工整,包含了許多無關的信息,中文網頁用到了詞典和切詞軟件,不應該在文本中出等詞,稱為停用詞,有效詞語要保證在200左右。
與關鍵詞有關的頁面排名因素1.標題標簽中第一個字或者詞使用關鍵詞
2.域名中含有關鍵詞
3.H 1標簽使用了關鍵詞
4.頁面上導出內部鏈接錨文字中使用了關鍵詞
5.頁面上導出外部鏈接錨文字中使用了關鍵詞
6.頁面前50-100個可見文字中使用了關鍵詞
7.子域名中包含關鍵詞
8.目錄名中還有關鍵詞
9.其他正文標題(H2、H3)中使用了關鍵詞常見術語
鏈接場(Link Farm)
在 SEO 術語中,鏈接場是指一個充滿鏈接的頁面,這些鏈接其實沒有實際作用,它們只作為鏈接存在,而沒有任何實際的上下文。那些采用運用黑帽 SEO 方法的人利用鏈接場,在一個頁面中增加大量鏈接,希望能通過這種方式使 Google 誤認為這個頁面很有鏈接的價值。
交互鏈接(Reciprocal Link)
也稱作雙向鏈接,是對一個網頁不光有超文本鏈接,同時對應有和原始網頁的鏈接。
有機列表(Organic Listing)
有機列表是 SERP 中的免費列表。有機列表的 SEO 通常涉及改進 Web 站點的實際內容,這往往是在頁面或基礎架構級別進行的。
PageRank
PageRank是迷戀Google的人們用來測試其站點在 Google 中的排名的一種度量標準。SEO 和搜索引擎營銷(SEM)專家也使用這個術語描述網頁在 SERP 中的排名以及 Google 根據排名算法給予站點的分數。無論如何定義,PageRank 都是 SEO 的重要部分。
付費列表(Paid Listing)
顧名思義,付費列表就是只有在付費后才能列入搜索引擎的服務。根據搜索引擎的不同,付費列表可能意味著:為包含于索引之中、每次點擊(PPC)、贊助商鏈接(Sponsored Link)或者在搜索目標關鍵詞和短語時讓站點出 SERP 中的其他方式而付費。
永久重定向(Permanent Redirect)
也被稱為301 重定向,是一條對網站瀏覽器的指令來顯示瀏覽器被要求顯示的不同的URL,當一個網頁經歷過其URL 的最后一次變化以后時使用。一個永久定向是一種服務器端的重定向,能夠被搜索引擎蜘蛛適當地處理。
排名(Ranking)
排名是頁面在目標關鍵詞的SERP中列出的位置。SEO 的目標是提高 Web 頁面針對目標關鍵詞的排名。
排名算法(Ranking Algorithm)
排名算法是搜索引擎用來對其索引中的列表進行評估和排名的規則。排名算法決定哪些結果是與特定查詢相關的。
搜索引擎營銷(Search Engine Marketing,SEM)
SEM 這個術語可以與 SEO 互換使用,但 SEM 常常是指通過付費和廣告向搜索引擎推銷 Web 站點,同時應用 SEO 技術。
搜索引擎優化(Search Engine Optimization,SEO)
SEO 就是根據對搜索引擎的吸引力和可見性來優化內容,從而使 Web 頁面能夠被搜索引擎選中。SEO 主要用來提高有機列表的排名。
搜索引擎結果頁面(Search Engine Results Page,SERP)
SERP 是為特定搜索顯示的列表或結果。SERP 有時候定義為搜索引擎結果的安排(placement)。根據本系列的目的,我將其稱為頁面而不是安排。在SEO領域中,在SERP中取得良好的表現就是一切。
垃圾技術(Spamming)
垃圾技術是一種欺詐性的SEO手段,它嘗試欺騙爬行器(Spider),并利用排名算法中的漏洞來影響針對目標關鍵詞的排名。垃圾技術可以表現為多種形式,但是 “垃圾技術” 最簡單的定義是 Web 站點用來偽裝自己并影響排名的任何技術。
關鍵字隱密字 (Hidden Text With Keyword Stuffing)
是另外一欺騙搜索引擎的做法。通常是指設置關鍵字的顏色和網頁背景顏色一樣,或通過 CSS Hidden Attribute (隱密特性) 來達到優化效果。這種做法一旦被Google發現,遭遇也會是該站點從Google的數據庫中除名。
爬行器(Spider)
爬行器在 Web 上漫游,尋找要添加進搜索引擎索引中的列表。爬行器有時也稱為 Web 爬行榜(Webcrawler)或機器人。針對有機列表優化頁面也就是為了吸引爬行器的注意。
在SEO中過多使用flash和Ajax技術,會給搜索引擎帶來很多麻煩,搜索引擎還不能很好地索引由flash、ajax表現的網頁,原因就是搜索引擎只索引頁面,而不會索引應用程序。
還有即使搜索引擎做到了完全解釋Flash文件或者ajax應用程序,并能分析和索引它們的相關內容,也還是沒有任何辦法使用url導航應用程序,對排名沒有一點幫助。搜索引擎的主要目標的是將搜索結果提交給用戶,但當處理這些媒體信息時,搜索引擎將無法排列這些信息的順序。Flash和Ajax將會帶來更多有創意的設計,也會帶來更難偵測的垃圾網站形式。
谷歌索引的Flash,給的建議就是,網站設計者應該僅在需要使用Flash和 Ajax的地方使用它,應該主要還是多使用HTML語言設計網站,而將Flash和Ajax作為輔助技術,為用戶提供切實的好處。通常,HTML和 JavaScript的混合也基本可以達到使用這些技術的效果。也就是說,在使用Flash和Ajax時應把它們當成頁面上的單元,而不是頁面本身。
Link Popularity 網站的鏈接廣泛度。
在搜索引擎排名中的作用已得到廣泛的認同和重視。即使站長們沒有在GOOGLE上提交站長們的站點,但與其它網站作了鏈接,Google也可能收錄站長們的網站。搜索引擎還可能完全依據站長們的鏈接廣泛度決定站長們的網站排名。
Internal Links 內部鏈接:本網站內部網頁之間的鏈接
External Links外部鏈接:本網站外部的鏈接,一般是指其他網站連到本網站的鏈接
Backward Links或Incoming/Inbound Links反向/導入鏈接:意義與“外部鏈接”接近,指其他網站連到本網站的鏈接
Outgoing/Outbound Links導出鏈接:指從本網站連到其他網站的鏈接
Search Engine Positioning 搜索引擎定位
Search Engine Ranking 搜索引擎排名
External Files外部文件存儲
把JavaScript文件和CSS文件分別放在JS和CSS外部文件中。這樣做的好處是把重要的頁面內容放到頁面頂部,同時能縮小文件大小。有利于搜索引擎快速準確地抓取頁面重要內容。
Keyword Density 關鍵詞密度
ROBOTS 搜索機器人
Affiliate Marketing 聯屬網絡營銷(會員制營銷、網站聯盟等)
聯屬網絡營銷 指的是一種網站A為網站B放置廣告按鈕,然后從為網站B帶來的銷售額中獲得回傭的一種廣告系統。某些廣告主通過這種方式獲得市場信息而不是現金銷售。這種方式被營銷費用比較緊張的新網站采用得比較普遍。
Cost-Per-Click (簡稱CPC)按點擊數付費
聯屬網絡營銷管理系統記錄每個客人在聯屬會員網站上點擊到商家網站的文字的或者圖片的鏈接(或者Email鏈接)次數,商家(Merchant)按每個點擊多少錢的方式支付廣告費。
Cost-Per-Lead (簡稱CPL)或Cost-Per-Acquisition (簡稱CPA)
按引導數付費或訪問者通過聯屬會員的鏈接進入商家網站后,如果填寫并提交了某個表單,管理系統就會產生一個對應給這個聯屬會員的引導(Lead)記錄,商家按引導記錄數給會員付費。
Cost-Per-Sale (簡稱CPS) 按銷售額付費
商家只在聯屬會員的鏈接介紹的客人在商家網站上產生了實際的購買行為后(大多數是在線支付)才給聯屬會員付費,一般是設定一個傭金比例(銷售額的10%到50%不等)。
Pay For Performance (按效果付費)
聯屬營銷按效果付費的營銷方式無論對于商家還是聯屬會員都是比較容易接受的。由于網站的自動化流程越來越完善,在線支付系統也越來越成熟,越來越多的聯屬網絡營銷系統采用按銷售額付費的方法。由于這種方法對商家來說是一種零風險的廣告分銷方式,商家也愿意設定比較高的傭金比例,這樣就使得這種方式的營銷系統被越來越多地采用。
Open Directory Project (簡稱ODP) 目錄索引
Full Text Search Engine 全文搜索引擎
Search Index/Directory 目錄索引類搜索引擎
META Search Engine 元搜索引擎
Spider 俗稱“蜘蛛”
Indexer 檢索程序
Free For All Links (簡稱FFA)免費鏈接列表
Stop Words/Filter Words 停用詞/過濾詞
這兩者意義一樣,都是指一些太常用以至沒有任何檢索價值的單詞,搜索引擎碰到這些詞時一般都會過濾掉。因此為節省空間,應盡量避免使用這一類的詞,尤其是在對文字數量有嚴格限制的地方。
Spam:搜索引擎垃圾技術的統稱
Frame Sets 框架結構
有些搜索引擎(如FAST)是不支持框架結構的,他們的“蜘蛛”程序無法閱讀這樣的網頁。
Image Maps 圖象區塊
當“蜘蛛”程序遇到這種結構時,往往會感到茫然不知所措。因此盡量不要設置Image Map鏈接。
Dynamic Pages 動態網頁
通過程序和數據庫連接制作的網頁,任何地址中帶“?”號、“&”號(及其他類似符號)的網頁都會把“蜘蛛”程序擋在門外。
Invisable/hidden text 隱藏文本內容
意欲在不影響網站美觀的前提下通過包含大量關鍵詞的網頁提高關鍵詞相關性得分,從而達到改善搜索引擎排名的目的。
Invisable/hidden links 隱藏鏈接
意欲在不影響網站美觀的前提下通過在其它頁面添加指向目標優化頁的隱形鏈接,通過提升鏈接得分而改善搜索引擎排名。
Misleading Words 誤導性關鍵詞
在頁面中使用與該網頁毫不相干的誤導性關鍵詞來吸引查詢該主題的訪問者訪問網站。這種做法嚴重影響了搜索引擎所提供結果的相關性和客觀性,為搜索引擎所深惡痛絕。
Repeated Words 重復性關鍵詞
這種作弊技術也被稱為“關鍵詞堆砌欺騙(Keyword Stuffing)”,
網站優化
它利用搜索引擎對網頁正文和標題中出現的關鍵詞的高度關注來對關鍵詞進行不合理的(過度)重復。類似的其它做法還包括在HTML元標識中大量堆砌關鍵字或使用多個關鍵字元標識來提高關鍵詞的相關性。這種技術很容易被搜索引擎察覺并受到相應懲罰。
Keyword Stuffing 關鍵詞堆砌
Cloaked Page 隱形頁面
對實際訪問者或搜索引擎任一方隱藏真實網站內容,以向搜索引擎提供非真實的搜索引擎友好的內容提升排名。
Deceptive redirects 欺騙性重定向
指把用戶訪問的第一個頁面(著陸頁)迅速重定向至一個內容完全不同的頁面。
Shadow Domain 鬼域
這是最常見的欺騙性重定向技術,通過欺騙性重定向使用戶訪問另外一個網站或頁面。
Meta Refresh刷新標識
Doorway Page 門頁
也叫“Bridge/Portal/Jump/Entry Page”。是為某些關鍵字特別制作的頁面,專為搜索引擎設計,目的是提高特定關鍵詞在搜索引擎中的排名所設計的富含目標關鍵詞的域名,且重定向至另一域名的真實網站。搜索引擎的Spiders往往忽略對那些自動重定向到其它頁的頁面的檢索。
Mirror Sites鏡象站點
通過復制網站或網頁的內容并分配以不同域名和服務器,以此欺騙搜索引擎對同一站點或同一頁面進行多次索引。大多數搜索引擎都提供有能夠檢測鏡象站點的適當的過濾系統,一旦發覺鏡象站點,則源站點和鏡象站點都會被從索引數據庫中刪除。
Link Spamming 作弊鏈接/惡意鏈接
link farms 鏈接工廠
Bulk Link Exchange Programs大宗鏈接交換程序
Cross Link交叉鏈接
Doorway Domain 門域
專為提高特定關鍵詞在搜索引擎中的排名所設計的富含目標關鍵詞的域名,然后重定向至其它域名的主頁。由于搜索引擎一般忽略自動重定向至其它頁的頁面的檢索,所以不提倡使用這種技術。
1、百度站長工具2、第三方站長免費工具3、百度指數4、百度統計5、17ce是國內專業做網站測速的第三方平臺6、5118數據分析平臺。7、換鏈神器是一款針對新手站長開發的友情鏈接交換互換平臺。8、流量精靈,9、好推網站seo免費在線診斷工具
第一步是對網站進行診斷。對網站進行全面的檢查,找出網站不利于排名的原因。
第二步是改網站。按照網站診斷結果對網站進行優化。
第三步就是優化關鍵字,如果前面的基礎打得好,這一步會比較輕松。
最后一步就是實現排名后進行維護了。搜索引擎是根據一定的算法進行網站排名的。通過搜索引擎優化,可以提高關鍵字排名。比較有效的方案就是整站優化,優化網站內部,提高網站權重。我們公司給上海電信、法國刻寶、中華藥業、美國貝迪等客戶提供的都是整優化的方案,流量平均提高300%