所謂相似,我的意思是兩個(gè)web頁(yè)面在頁(yè)面內容上基本相同。在這種情況下,兩個(gè)web頁(yè)面可以視為相似的。當比較兩個(gè)網(wǎng)頁(yè)的搜索引擎,它使用個(gè)特定的算法比較,和搜索引擎通常使用兩種方法來(lái)比較:個(gè)是基于web頁(yè)面總結比較,如果多個(gè)網(wǎng)頁(yè)摘要的md5值是相同的,它證明了這些網(wǎng)頁(yè)有高度的相似性。二是根據網(wǎng)頁(yè)關(guān)鍵詞,按詞頻順序,可以取N個(gè)高頻詞,如果其md5值相同,則可以認為這些網(wǎng)頁(yè)具有較高的相似度。谷歌搜索引擎將web頁(yè)面的相似度設置為60%。也就是說(shuō),如果兩個(gè)web頁(yè)面的相似度超過(guò)60%,那么所比較的web頁(yè)面將不再包括在內。如果相似度接近60%,比較的網(wǎng)頁(yè)也可以包括在內,但是搜索引擎給出的權重相對較。這就是搜索引擎對待web相似性的方式??梢钥闯?,網(wǎng)頁(yè)相似度對我們網(wǎng)站的影響主要在于被比較的網(wǎng)頁(yè)是否可以被包含,而對其他方面沒(méi)有影響。
有兩個(gè)主要原因網(wǎng)絡(luò )相似的問(wèn)題:(1)在同網(wǎng)站,舊web頁(yè)面復制為個(gè)網(wǎng)頁(yè),導致內部的頁(yè)面標題,關(guān)鍵詞,描述信息,內容變化相對較少,結果判斷相似度高的搜索引擎。(2)在不同站點(diǎn)之間,將原來(lái)曾經(jīng)被收錄的網(wǎng)頁(yè)的內容拿來(lái),,和稍微改變或偽原創(chuàng ),導致更少的內容更改,或者只是段調整,內容并沒(méi)有改變,這類(lèi)似于復制,被搜索引擎判定為相似。相似度判斷網(wǎng)頁(yè)搜索引擎,是相當聰明的,不是我們想象的簡(jiǎn)單的比較從頭到尾,而是智能的分析和比較,我們不冒風(fēng)險,認為復制別人的網(wǎng)頁(yè)內容,給出個(gè)簡(jiǎn)單的改變就可以蒙混過(guò)關(guān)。
有兩個(gè)主要原因網(wǎng)絡(luò )相似的問(wèn)題:(1)在同網(wǎng)站,舊web頁(yè)面復制為個(gè)網(wǎng)頁(yè),導致內部的頁(yè)面標題,關(guān)鍵詞,描述信息,內容變化相對較少,結果判斷相似度高的搜索引擎。(2)在不同站點(diǎn)之間,將原來(lái)曾經(jīng)被收錄的網(wǎng)頁(yè)的內容拿來(lái),,和稍微改變或偽原創(chuàng ),導致更少的內容更改,或者只是段調整,內容并沒(méi)有改變,這類(lèi)似于復制,被搜索引擎判定為相似。相似度判斷網(wǎng)頁(yè)搜索引擎,是相當聰明的,不是我們想象的簡(jiǎn)單的比較從頭到尾,而是智能的分析和比較,我們不冒風(fēng)險,認為復制別人的網(wǎng)頁(yè)內容,給出個(gè)簡(jiǎn)單的改變就可以蒙混過(guò)關(guān)。
有了問(wèn)題,我們就需求進(jìn)行矯正,下次防止再犯同樣的錯誤。關(guān)于網(wǎng)頁(yè)類(lèi)似度的問(wèn)題,我們曉得了形成的緣由,就能夠有的放矢。有效的方法來(lái)解決相似的網(wǎng)頁(yè)是做你真正的原創(chuàng ),假如你的網(wǎng)頁(yè)內容是原創(chuàng )出來(lái)的,只需內容質(zhì)量高,就肯定不會(huì )由于網(wǎng)頁(yè)類(lèi)似度的問(wèn)題而不收錄,普通的都能被收錄的。如果你沒(méi)有太多的時(shí)間的站長(cháng)寫(xiě)原創(chuàng )文章,或限于水平問(wèn)題不能寫(xiě)高質(zhì)量的原創(chuàng )文章,你也可以進(jìn)行偽原創(chuàng ),但是我們建議你避免相似的問(wèn)題頁(yè)面,您需要重大改變原來(lái)的文章中,變化的程度,少也要超過(guò)50%,所以你可能會(huì )包括搜索引擎。
此外,我們建議您網(wǎng)站管理員,在web頁(yè)面中,為了節省時(shí)間,如果你需要復制原始的網(wǎng)頁(yè),然我們也建議您在web頁(yè)面的標題,關(guān)鍵詞,描述信息和內容也大幅改變,否則你的網(wǎng)頁(yè)很難被收錄的。在進(jìn)行更改時(shí),可以使用些不同的代碼替換原始代碼,例如使用iFrame框架替換內容的前部分等等。我做的網(wǎng)站建設領(lǐng)域很長(cháng)段時(shí)間,滿(mǎn)足相似性問(wèn)題,因為網(wǎng)站不包括,不少在谷歌adsense管理平臺也有個(gè)HTML文檔的工具,如果兩個(gè)頁(yè)面的標題和描述信息,網(wǎng)站管理員工具將提示您高相似度的兩頁(yè),然我們可以修改。建議站長(cháng)們多進(jìn)入搜索引擎的管理平臺,利用里面提供的功能,有時(shí)會(huì )對網(wǎng)站建設非常有益。