1、網站SEO問題:網站首頁被重復收錄了很多次怎麼辦?
一、網站頁面重復收錄的原因是什麼?
在網站優化過程中,搜索引擎並不喜歡重復內容的收錄,一直強調的也是原創,那為什麼網站同一頁面還會重復收錄呢?
一般後綴出現了一個問號或者其他的字元串,是因為百度收錄文章的同時,會給該篇文章加一個標簽,但是訪問網站的時候,會自動跳轉回來原來的網站,首頁或者內頁,至於內頁的鏈接被收錄到首頁有可能是因為該篇文章設置在首頁上顯示,所以最終的鏈接地址指向了首頁。
1.搜索引擎識別問題—搜索引擎畢竟只是人為編寫的一套規則,做不到充分的識別,所以導致部分URL地址的內容重復收錄。
2.程序設計問題—有些程序在設計中為了「預覽」方便在後台存在動態頁面。但因設計不當,導致搜索引擎依舊通過目錄的索引便可發現這一存在,進而對其索引收錄。
3.模板問題—在模板製作中常常易忽視這一問題,最後模板完成後既存在動態頁面,又存在靜態頁面,如此怎能不被搜索引擎重復收錄呢?
4.網站改版—網站改版可能會導致一些URL地址的重復收錄。
二、網站頁面重復收錄該如何處理?
可以從以下四個方面著手:
1.URL標准化
在網站建設過程中盡量統一URL地址,勿使用動態頁面進行鏈接,一來是搜索引擎青睞靜態頁面,另一方面也可以防止相同內容被搜索引擎重復收錄。
2.利用robots.txt屏蔽動態文件
利用robots.txt進行動態文件的屏蔽,如:「Disallow: /?」即屏蔽了根目錄下帶」?」的頁面,這個可以自己靈活設置。
3.及時的清除緩存
每個網站都會帶有兩個網址,一般網站更新文章後都需要生成靜態的網址,本身就存在一個動態的,自然生成靜態後就會多出一個網址,這樣的話,如果沒及時清除緩存,就可能使得同一個頁面的靜態,動態URL網址都被收錄,因為這搜索引摯把同一篇文章的兩個網址看作是獨立的,自然就兩個都被收錄了。所以,及時清除緩存可以很大程度上減少網頁被重復收錄。
4.利用網站地圖引導蜘蛛
網站地圖的作用不單單是把整站的內容進行歸納,而且還可以讓蜘蛛爬行更加的順暢無阻,有序的抓取網站內的各個頁面,從而也能減少蜘蛛對網站頁面重復收錄的概率。
2、網站首頁有幾個重復地址,對SEO的影響有哪些
URL是搜索引擎對頁面的唯一標識,多個重復地址,意味著多個重復頁面。
影像如下:
1.在站內就有多個頁面競爭同一個關鍵詞排名
2.站內頁面相似度過高會判罰
3. 如果有大量重復頁面,浪費搜索引擎對你網站的各項配額。
4. 丟失很多本應拿到的鏈接加分,站外渠道的鏈接往往是最優質的。同一個URL的分值可能分散成幾十份。
解決方案:
1.規范URL
2.不規范的URL301到規范的URL
排名掉光肯定不是這一個問題導致的,需要對網站完全的診斷
3、SEO:標題重復對網站有哪些影響?
「清風演算法」,嚴懲標題作弊,標題重復可能被看成作弊行為。
4、重復增加內容頁對網站seo有用嗎?
沒多少用,重復的內容只能增加網站的活躍度,發布大量重復的內容可能會導致網站降權。站內文章重復會存在相互競爭,純屬浪費時間;站與站之間內容重復,常見的如文章轉載,搜索引擎對新發布的內容有一定的推薦機制,畢竟蜘蛛也喜歡新的東西。
5、seo中標題圖重復出現會有什麼影響
我個人認為把搜索引擎的權重可以分為:關鍵詞權重和頁面權重(URL),而您說的seo中的標題重復會有什麼影響?這就涉及到「關鍵詞權重」的問題,標題中(關鍵詞)都是一樣的話,那麼搜索引擎就會認為這類的標題重復性太高,也就會導致標題中的關鍵詞權重下降,頁面的收錄和排名就會比較困難。
希望能幫到您,祝您生活愉快!
6、懂SEO的進來,如何處理大量重復的頁面?
重復內容對SEO有很大的負面影響。 出現重復內容原因 重復內容的原因有一大堆. 大多數理由是技術上的: 一個人選擇將相同的內容放在不同的地方而不區分原始源, 這對於我們大多數人感覺是不正常的. 這種情況比較少見. 當然技術原因也有很多. 它發生的主要原因在於開發人員不是以一個瀏覽器或一個用戶, 更別提一個搜索引擎的蜘蛛的方式來思考, 他們以開發人員的思維來進行思考. 上述提到的文章即 http://www.example.com/keyword-x/ 和 http://www.example.com/article-category/keyword-x/, 如果你問開發人員, 他會說這種情況只會出現一次, 以後不會有了. URL概念的錯誤理解 開發人員瘋了嗎? 沒有, 他只是使用不同的語言說話. 你看到整個網站可能由一個資料庫系統驅動. 在那個資料庫, 只有一篇文章, 網站的軟體允許同樣的文章在資料庫中通過不同的URL獲取. 那是因為在開發人員的眼中, 文章的唯一標識在於在資料庫中的文章ID, 而不是URL. 對搜索引擎而言, URL是一個內容的唯一標識. 如果你向一個開發人員解釋這個, 他就會開始有問題, 然後如果他像我認識和一起工作的大多數開發人員,那他就會出來一大堆的理由說搜索引擎有多麼地笨然後為什麼他不能對這個進行處理. 他錯了. Session ID 你經常想跟蹤訪客, 且讓這種可能實現, 比如存儲他們購買車的想買的物品. 要做到這個, 你需要給他們一個session(會話). 一個會話基本上就是一個訪客在你的網站的所做所為的簡要歷史記錄, 可以包含像他們的購物車上的物品之類的東西. 為了在訪客從一個頁面到另一個頁面時能保持這個會話, 會話的唯一標識需要保存在一個地方. 最常見的解決方法就是使用cookie來保存會話, 但是搜索引擎通常不保存cookie. 這時有一些系統就會在URL上使用會話ID. 當在URL上使用會話ID時, 網站的獲得會話ID的每個內部鏈接都會將會話ID附加到URL上, 因為會話ID對於那個會話是獨特的,它會創建一個新的URL, 因此產生重復內容. 用來跟蹤和排序的URL參數 另外一個導致重復內容的原因是在URL中使用的參數不會改變頁面內容, 比如跟蹤鏈接. 後面這個可能允許你跟蹤人們的來源, 它就可能讓你很難獲取一個好的排名, 這是一個不想要的邊際作用. 這個不只對跟蹤參數這個例子有效, 同時它還適用於你添加到URL中的每一個參數, 而這些參數並不修改內容的重要部分. 不管這個參數是用來改變一個產品集的排序方式還是用來展示另一個邊欄, 他們都導致了重復內容. 內容採集器 雖然大部分導致重復內容的原因都是你自己的, 或至少是你的網站的. 但有時候有些網站在經你同意或未經你同意的情況下使用你的內容. 他們並不總是鏈接到你的原始文章,因此搜索引擎不知道, 然後需要處理相同文章的另一個版本. 你的網站越流行, 更多的內容採集器就會來到你的網站上, 讓這個問題越來越大. 參數順序 另外一個常見的原因就是CMS不使用一個好的干凈的URL, 但是使用像/?id=1&cat=2之類的URL, id引用到文章, cat引用到分類. 在大部分網站系統中URL /?cat=2&id=1 會獲取相同的結果. 但是他們對於搜索引擎來說確實是完全不同的. 評論分頁 在我喜歡的Wordpress中, 但也包括其它一些系統, 有一個選項讓你選擇是否對評論分頁. 這會導致在文章URL, 文章URL+/comment-page-1/和/comment-page-2/ 中產生重復的內容. 適於列印機的頁面 如果你的內容管理系統創建適合於列印機的頁面, 然後你從你的文章頁面鏈接到這些頁面, 在大部分情況下Google會發現這些, 除非你特別阻攔他們. 現在的話Google應該選擇哪個版本? 是載入有廣告的周邊內容的這個還是只有你的文章的那個頁面? WWW還是non-WWW? 在書中最老的一種, 但是有時搜索引擎還是會搞錯: WWW 還是non-WWW, 當你的網站可以通過這兩種方式來訪問時, 就會產生重復內容. 一個沒有這么常見的情況是http和https的重復內容, 通過兩種方式都得到相同的內容. 概念解決方法: 「canonical」 URL 如上面所說的, 不同的URL導致相同的內容是個問題 的事實是可以解決的. 一個人在發表內容時在正常情況下能夠輕易地告訴你一篇特定的文章的正確URL應該是哪個. 有趣的是有時候, 當你向3個在相同公司的人詢問時, 他們會給出3個不同的答案. 在這些案例中這是個需要被解決的問題. 因為最後他們可以是唯一一個URL. 顯示內容的正確的URL 在搜索引擎稱為Canonical URL. 關於Canonical URL的更評細介紹可以參考: 在鏈接中添加rel=」canonical」到底有什麼作用?. 識別重復內容問題 你可能不知道在你的網站上是否有重復內容. 讓我給你一些方法來檢查你是否存在這個問題. Google Webmaster Tools Google Webmaster Tools是一個識別重復內容的好工具. 如果你在Google Webmaster Tools添加你的網站, 然後選擇你的網站, 依次進入Diagnostics -> HTML Suggestions, 你就可以看到: 如果頁面有重復標題或重復描述, 那就不會是一個好事情. 點擊他們會顯示包含重復標題或描述的URL, 這可以幫助你識別問題. 問題是如果你有一篇關於 「keyword x」的文章, 他們在兩個分類中顯示, 標題可能會不一樣. 他們只能是 「Keyword X – Category X – Example Site」或「Keyword X – Category Y – Example Site」. Google不會把這些作為重復標題, 但是你可以通過搜索引擎發現他們. 標題搜索或片段搜索 有一些搜索操作符對於這些情況非常有用. 如果你想找出在你的網站上所有包含Keyword X 文章的URL, 你可以在Google中輸入以下搜索串: 1 site:example.com intitle:"Keyword X" Google 會展示在example.com上包含那個關鍵詞的所有頁面. 你在intitle部分指定的越具體, 你就越容易找出重復內容. 你可以使用同樣的方法來在web中識別重復內容. 讓我們看看以」Keyword X – why it is awesome」為標題的你的文章, 你可以搜索: 1 intitle:"Keyword X - why it is awesome" Google會給出匹配這個標題的所有網站. 有時候搜索你的文章中的一個或兩個完整的句子都是可以的, 因為有些採集器會修改標題. 在有些情況下, 當你實施一個那樣的搜索時, Google會在結果的最後頁顯示一個提示, 如下: 這是一件標志, 意味著Google已經對搜索去掉了重復內容. 這仍然不好, 因此還是值得點擊鏈接和查找其它的所有結果和看看你是否修復了那些. 重復內容的實際解決方法 一旦你設定你的內容的URL為canonical URL 你必須開始canonicalization過程. 這就意味著我們必須讓搜索結果知道且讓它盡快找到頁面的canonical版本. 基本上有四種解決這個問題的方法, 按優先順序排序, 如下: 不創建重復內容 重定向重復內容到 canonical URL 添加一個canonical鏈接元素到重復頁面 從重復頁面添加一個HTML鏈接到canonical頁面 避免重復內容 上面的一些引起重復內容的原因可以被簡單的修復: 在你的URL中包含session ID? 這通常可以在你的系統設置中禁用它. 有適合於列印機的頁面? 這是完全沒有必要的, 你應該只使用一個print style sheet. 在Wordpress中使用評論分頁? Using comment pagination in WordPress? 這個特性應該被禁用. 不同順序的參數? 叫你的程序員創建一個腳本來對參數排序, 使得參數總是以相同的順序出現. 跟蹤鏈接問題? 在大部分情況你可以使用hash tag based campaign tracking 來代替基於參數的跟蹤. WWW還是non-WWW問題? 選擇一個, 然後對另一個使用重定向. 你也可以在Google Webmaster Tools設置優先項, 前提是你必須聲明你擁有這兩個域名. 如果你的問題並不是這么好修復, 那麼還是值得在這個問題上投入精力來防止重復內容的出現. 這是至今為止解決這個問題的最好辦法. 重復內容301重定向 在有些情況下, 你不能完全阻止你使用的系統對你的內容創建錯誤的URL, 但是有時你可以重定向他們. 同樣的, 如果你在處理重復內容問題, 確保你重定向了所有舊的重復內容的URL到合適的canonical URL. 使用rel=」canonical」 鏈接 有時你不想或不能去掉一篇文章的重復版本, 但是你知道它是錯誤的URL. 為了對付這個問題, 搜索引擎引入了canonical 鏈接元素. 它放置在你的網站的<head>片段, 看起來如下: 1 <link rel="canonical" href=" http://example.com/keyword-x/"/> 在canonical鏈接的href部分你為你的文章放置了正確的canonical URL . 當Google (或其它支持的搜索引擎)發現這個鏈接元素, 它就會做一個301重定向, 將大部分重復內容的鏈接重定向到你的canonical 頁面. 這個過程會比301重定向慢一些, 因此如果你可以做一個301重定向, 那301重定向是一個優先的選擇, 鏈回到原始內容 如果上面的你都不能做, 因為你不能控制你的網站的<head>部分如何顯示, 在文章頂部或底部添加一個鏈回到原始文章的鏈接是一個好主意.這可能是你想在RSS feed中想做的事:添加一個鏈接鏈迴文章. 一些採集器會過濾掉鏈接, 但是其它一些就留下來, 如果Google遇到一些鏈接指向你的文章, 它就會馬上發現這是文章真正的canonical 版本. 結論: 重復內容是可以解決的, 且應該解決 重復內容無處不在. 我曾經遇到過一個網站, 有超過1000個頁面至少有一微小的重復內容頁面. 這是一個你需要時刻保持警惕的東西. 它是可以解決的, 解決後的回報也是可觀的. 在解決了你的網站的重復內容之後你的有質量的內容可能會在排名中驟升. 參考文章: http://www.jsxubar.info/plicate-content.html/