時間:2022-08-26
大家好!今天讓智恒博網(wǎng)絡(luò)小編來大家介紹下關(guān)于搜索引擎優(yōu)化開發(fā)服務(wù)_搜索引擎優(yōu)化實施的問題,以下是小編對此問題的歸納整理,來看看吧。咨詢網(wǎng)站優(yōu)化,請致電:15110400103(同微信)
文章目錄列表:
一、網(wǎng)站如何做搜索引擎優(yōu)化
1、確定要優(yōu)化的網(wǎng)站,確定該網(wǎng)站的域名、ip、空間、主要關(guān)鍵詞等首先我們要了解所要優(yōu)化的網(wǎng)站,了解改行業(yè)、網(wǎng)站主題內(nèi)容、網(wǎng)站基礎(chǔ)情況。分析網(wǎng)站域名情況,是否被搜索引擎懲罰過,是否多域名情況,域名的年限、PR等。確定IP地址是否被搜索引擎懲罰過,確定同IP下的網(wǎng)站情況,空間主要是分析速度、穩(wěn)定性等等。最主要的是要確定關(guān)鍵詞,確定網(wǎng)站要優(yōu)化和排名的關(guān)鍵詞。分析難度以便后期合理的安排優(yōu)化工作。2、明確客戶的要求、理解客戶網(wǎng)站優(yōu)化的目的客戶是要關(guān)鍵詞排名、品牌價值、還是要流量增加。一般企業(yè)網(wǎng)站需要的是關(guān)鍵詞排名和品牌價值。而行業(yè)站需要的是流量和品牌價值,那么可能有人就要問了,這有什么區(qū)別呢?一般關(guān)鍵詞的排名并不代表有流量、并不代表有大流量、更可能是代理品牌價值和準客戶。而行業(yè)站一般需要的是流量,關(guān)鍵詞需要優(yōu)化的人根據(jù)網(wǎng)站行業(yè)、服務(wù)等內(nèi)容來確定目標關(guān)鍵詞、輔助關(guān)鍵詞、擴展關(guān)鍵詞、長尾關(guān)鍵詞來做大流量。而企業(yè)站一般只需要主關(guān)鍵詞的排名。具體要根據(jù)客戶的要求來分析。3、分析、調(diào)整網(wǎng)站結(jié)構(gòu)以便更加適合搜索引擎優(yōu)化一般客戶需要優(yōu)化的網(wǎng)站都是已經(jīng)建設(shè)好的網(wǎng)站,很多比較差的建站公司建站前沒有考慮seo內(nèi)容,更有甚至素質(zhì)低劣的網(wǎng)絡(luò)公司故意不考慮seo,以便后期客戶需要seo是再做修改收費。這種種都揭示我們在做網(wǎng)站策劃時就要充分考慮網(wǎng)站后期推廣和優(yōu)化。將seo工作做在前面。根據(jù)搜索引擎的算法來確定網(wǎng)站的結(jié)構(gòu)是否合理,進一步做出合理的調(diào)整方案、關(guān)鍵詞布局工作等。4、修改、添加網(wǎng)頁代碼,例如靜態(tài)化、代碼減肥、連接布局、關(guān)鍵詞布局、文本版塊布局等修改網(wǎng)站冗余代碼、不合理的代碼設(shè)置,例如框架設(shè)計、flash、js的應(yīng)用等。友情鏈接的代碼分析,很多人將友情鏈接寫成js調(diào)用這樣也是不合理的。頁面關(guān)鍵詞的布局、文本的設(shè)置、超鏈接的設(shè)置等等網(wǎng)站內(nèi)部優(yōu)化工作內(nèi)容。5、網(wǎng)站更新源添加和內(nèi)鏈建設(shè)網(wǎng)站在做搜索引擎優(yōu)化工作時都需要有一個合理的更新源支持后期排名工作的維持,所以在優(yōu)化工作步驟中就要考慮設(shè)置更新源的因素。內(nèi)部鏈接的建設(shè)也是網(wǎng)站優(yōu)化的重中之重,是網(wǎng)站內(nèi)部優(yōu)化的主要工作。6、外鏈建設(shè)外連分類、外連做法、外連建設(shè)技巧等豐富實用內(nèi)容。7、查看流量、關(guān)鍵詞排名、統(tǒng)計分析。確定長尾關(guān)鍵詞的設(shè)置以帶來更大收益。二、搜索引擎優(yōu)化SEO的步驟有哪些?應(yīng)該怎么做?
SEO是一項需要足夠耐心和細致的腦力勞動,并按以下6個步驟進行:第一,分析關(guān)鍵詞。這是SEO的關(guān)鍵環(huán)節(jié),分析關(guān)鍵詞主要對關(guān)鍵詞的搜索量、競爭對手分析、關(guān)鍵詞布置、關(guān)鍵詞與網(wǎng)站相關(guān)性等內(nèi)容進行分析。第二,分析網(wǎng)站架構(gòu)。合理的網(wǎng)站架構(gòu)更容易獲得搜索引擎的喜好,更容易獲得較好的SEO效果。分析網(wǎng)站架構(gòu)主要是剔除網(wǎng)站架構(gòu)不良設(shè)計等問題,一般會采取樹狀目錄結(jié)構(gòu)、優(yōu)化網(wǎng)站導(dǎo)航與鏈接的方式來實現(xiàn)該目的。第三,優(yōu)化網(wǎng)站目錄和頁面。SEO在提升網(wǎng)站首頁在搜索引擎排名的基礎(chǔ)上還能提升網(wǎng)站頁面的訪問量與瀏覽量。第四,發(fā)布內(nèi)容和做好內(nèi)鏈。因為搜索引擎偏好于規(guī)律更新的網(wǎng)站內(nèi)容,因此億仁網(wǎng)絡(luò)認為如何調(diào)整與合理安排網(wǎng)站內(nèi)容發(fā)布日程也是技術(shù)人員要掌握的重要技能。此外,還要通過合理的鏈接布置使整個網(wǎng)站有機地串聯(lián)起來,一般在該過程中也會展開友情鏈接工作。第五,與搜索引擎對話。通過搜索引擎來看SEO的效果,一般要求SEO技術(shù)人員能掌握集中搜索引擎網(wǎng)站的管理工具。第六,分析網(wǎng)站流量。通過分析網(wǎng)站流量能夠?qū)⒈敬蔚腟EO結(jié)果作為展開下一次SEO的指導(dǎo)策略支持,這也對提升用戶體驗具有指導(dǎo)意義。三、開發(fā)搜索引擎需要具備哪些知識?
隨著互聯(lián)網(wǎng)的迅猛發(fā)展、WEB信息的增加,用戶要在信息海洋里查找自己所需的信息,就象大海撈針一樣,搜索引擎技術(shù)恰好解決了這一難題(它可以為用戶提供信息檢索服務(wù))。搜索引擎是指互聯(lián)網(wǎng)上專門提供檢索服務(wù)的一類網(wǎng)站,這些站點的服務(wù)器通過網(wǎng)絡(luò)搜索軟件(例如網(wǎng)絡(luò)搜索機器人)或網(wǎng)絡(luò)登錄等方式,將Intemet上大量網(wǎng)站的頁面信息收集到本地,經(jīng)過加工處理建立信息數(shù)據(jù)庫和索引數(shù)據(jù)庫,從而對用戶提出的各種檢索作出響應(yīng),提供用戶所需的信息或相關(guān)指針。用戶的檢索途徑主要包括自由詞全文檢索、關(guān)鍵詞檢索、分類檢索及其他特殊信息的檢索(如企業(yè)、人名、電話黃頁等)。下面以網(wǎng)絡(luò)搜索機器人為例來說明搜索引擎技術(shù)。 1.網(wǎng)絡(luò)機器人技術(shù) 網(wǎng)絡(luò)機器人(Robot)又被稱作Spider、Worm或Random,核心目的是為獲取Intemet上的信息。一般定義為“一個在網(wǎng)絡(luò)上檢索文件且自動跟蹤該文件的超文本結(jié)構(gòu)并循環(huán)檢索被參照的所有文件的軟件”。機器人利用主頁中的超文本鏈接遍歷WWW,通過U趾引用從一個HT2LIL文檔爬行到另一個HTML文檔。網(wǎng)上機器人收集到的信息可有多種用途,如建立索引、HIML文件合法性的驗證、uRL鏈接點驗證與確認、監(jiān)控與獲取更新信息、站點鏡像等。 機器人安在網(wǎng)上爬行,因此需要建立一個URL列表來記錄訪問的軌跡。它使用超文本,指向其他文檔的URL是隱藏在文檔中,需要從中分析提取URL,機器人一般都用于生成索引數(shù)據(jù)庫。所有WWW的搜索程序都有如下的工作步驟: (1)機器人從起始URL列表中取出URL并從網(wǎng)上讀取其指向的內(nèi)容; (2)從每一個文檔中提取某些信息(如關(guān)鍵字)并放入索引數(shù)據(jù)庫中; (3)從文檔中提取指向其他文檔的URL,并加入到URL列表中; (4)重復(fù)上述3個步驟,直到再沒有新的URL出現(xiàn)或超出了某些限制(時間或磁盤空間); (5)給索引數(shù)據(jù)庫加上檢索接口,向網(wǎng)上用戶發(fā)布或提供給用戶檢索。 搜索算法一般有深度優(yōu)先和廣度優(yōu)先兩種基本的搜索策略。機器人以URL列表存取的方式?jīng)Q定搜索策略:先進先出,則形成廣度優(yōu)先搜索,當起始列表包含有大量的WWW服務(wù)器地址時,廣度優(yōu)先搜索將產(chǎn)生一個很好的初始結(jié)果,但很難深入到服務(wù)器中去;先進后出,則形成深度優(yōu)先搜索,這樣能產(chǎn)生較好的文檔分布,更容易發(fā)現(xiàn)文檔的結(jié)構(gòu),即找到最大數(shù)目的交叉引用。也可以采用遍歷搜索的方法,就是直接將32位的IP地址變化,逐個搜索整個Intemet。 搜索引擎是一個技術(shù)含量很高的網(wǎng)絡(luò)應(yīng)用系統(tǒng)。它包括網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)動標引技術(shù)、檢索技術(shù)、自動分類技術(shù),機器學習等人工智能技術(shù)。 2.索引技術(shù) 索引技術(shù)是搜索引擎的核心技術(shù)之一。搜索引擎要對所收集到的信息進行整理、分類、索引以產(chǎn)生索引庫,而中文搜索引擎的核心是分詞技術(shù)。分詞技術(shù)是利用一定的規(guī)則和詞庫,切分出一個句子中的詞,為自動索引做好準備。目前的索引多采用Non—clustered方法,該技術(shù)和語言文字的學問有很大的關(guān)系,具體有如下幾點: (1)存儲語法庫,和詞匯庫配合分出句子中的詞匯; (2)存儲詞匯庫,要同時存儲詞匯的使用頻率和常見搭配方式; (3)詞匯寬,應(yīng)可劃分為不同的專業(yè)庫,以便于處理專業(yè)文獻; (4)對無法分詞的句子,把每個字當作詞來處理。 索引器生成從關(guān)鍵詞到URL的關(guān)系索引表。索引表一般使用某種形式的倒排表(1nversionUst),即由索引項查找相應(yīng)的URL。索引表也要記錄索引項在文檔中出現(xiàn)的位置,以便檢索器計算索引項之間的相鄰關(guān)系或接近關(guān)系,并以特定的數(shù)據(jù)結(jié)構(gòu)存儲在硬盤上。 不同的搜索引擎系統(tǒng)可能采用不盡相同的標引方法。例如Webcrawler利用全文檢索技術(shù),對網(wǎng)頁中每一個單詞進行索引;Lycos只對頁名、標題以及最重要的100個注釋詞等選擇性詞語進行索引;Infoseek則提供概念檢索和詞組檢索,支持and、or、near、not等布爾運算。檢索引擎的索引方法大致可分為自動索引、手工索引和用戶登錄三類。 3. 檢索器與結(jié)果處理技術(shù) 檢索器的主要功能是根據(jù)用戶輸入的關(guān)鍵詞在索引器形成的倒排表中進行檢索,同時完成頁面與檢索之間的相關(guān)度評價,對將要輸出的結(jié)果進行排序,并實現(xiàn)某種用戶相關(guān)性反饋機制。 通過搜索引擎獲得的檢索結(jié)果往往成百上千,為了得到有用的信息,常用的方法是按網(wǎng)頁的重要性或相關(guān)性給網(wǎng)頁評級,進行相關(guān)性排序。這里的相關(guān)度是指搜索關(guān)鍵字在文檔中出現(xiàn)的額度。當額度越高時,則認為該文檔的相關(guān)程度越高。能見度也是常用的衡量標準之一。一個網(wǎng)頁的能見度是指該網(wǎng)頁入口超級鏈接的數(shù)目。能見度方法是基于這樣的觀點:一個網(wǎng)頁被其他網(wǎng)頁引用得越多,則該網(wǎng)頁就越有價值。特別地,一個網(wǎng)頁被越重要的網(wǎng)頁所引用,則該網(wǎng)頁的重要程度也就越高。結(jié)果處理技術(shù)可歸納為: (1)按頻次排定次序 通常,如果一個頁面包含了越多的關(guān)鍵詞,其搜索目標的相關(guān)性應(yīng)該越好,這是非常合平常理的解決方案。 (2)按頁面被訪問度排序 在這種方法中,搜索引擎會記錄它所搜索到的頁面被訪問的頻率。人們訪問較多的頁面通常應(yīng)該包含比較多的信息,或者有其他吸引入的長處。這種解決方案適合一般的搜索用戶,而因為大部分的搜索引擎都不是專業(yè)性用戶,所以這種方案也比較適合一般搜索引擎使用。 (3)二次檢索 進一步凈化(比flne)結(jié)果,按照一定的條件對搜索結(jié)果進行優(yōu)化,可以再選擇類別、相關(guān)詞進行二次搜索等。 由于目前的搜索引擎還不具備智能,除非知道要查找的文檔的標題,否則排列第一的結(jié)果未必是“最好”的結(jié)果。所以有些文檔盡管相關(guān)程度高,但并不一定是用戶最需要的文檔。 搜索引擎技術(shù)的行業(yè)應(yīng)用: 搜索引擎的行業(yè)應(yīng)用一般指類似于千瓦通信提供的多種搜索引擎行業(yè)與產(chǎn)品應(yīng)用模式,大體上分為如下幾種形式: 1、 政府機關(guān)行業(yè)應(yīng)用 n 實時跟蹤、采集與業(yè)務(wù)工作相關(guān)的信息來源。 n 全面滿足內(nèi)部工作人員對互聯(lián)網(wǎng)信息的全局觀測需求。 n 及時解決政務(wù)外網(wǎng)、政務(wù)內(nèi)網(wǎng)的信息源問題,實現(xiàn)動態(tài)發(fā)布。 n 快速解決政府主網(wǎng)站對各地級子網(wǎng)站的信息獲取需求。 n 全面整合信息,實現(xiàn)政府內(nèi)部跨地區(qū)、跨部門的信息資源共享與有效溝通。 n 節(jié)約信息采集的人力、物力、時間,提高辦公效率。 2、企業(yè)行業(yè)應(yīng)用 n 實時準確地監(jiān)控、追蹤競爭對手動態(tài),是企業(yè)獲取競爭情報的利器。 n 及時獲取競爭對手的公開信息以便研究同行業(yè)的發(fā)展與市場需求。 n 為企業(yè)決策部門和管理層提供便捷、多途徑的企業(yè)戰(zhàn)略決策工具。 n 大幅度地提高企業(yè)獲取、利用情報的效率,節(jié)省情報信息收集、存儲、挖掘的相關(guān)費用,是提高企業(yè)核心競爭力的關(guān)鍵。 n 提高企業(yè)整體分析研究能力、市場快速反應(yīng)能力,建立起以知識管理為核心的競爭情報數(shù)據(jù)倉庫,是提高企業(yè)核心競爭力的神經(jīng)中樞。 3、新聞媒體行業(yè)應(yīng)用 n 快速準確地自動跟蹤、采集數(shù)千家網(wǎng)絡(luò)媒體信息,擴大新聞線索,提高采集速度。 n 支持每天對數(shù)萬條新聞進行有效抓取。監(jiān)控范圍的深度、廣度可以自行設(shè)定。 n 支持對所需內(nèi)容智能提取、審核。 n 實現(xiàn)互聯(lián)網(wǎng)信息內(nèi)容采集、瀏覽、編輯、管理、發(fā)布的一體化。 4、 行業(yè)網(wǎng)站應(yīng)用 n 實時跟蹤、采集與網(wǎng)站相關(guān)的信息來源。 n 及時跟蹤行業(yè)的信息來源網(wǎng)站,自動,快速更新網(wǎng)站信息。動態(tài)更新信息。 n 實現(xiàn)互聯(lián)網(wǎng)信息內(nèi)容采集、瀏覽、編輯、管理、發(fā)布的一體化。 n 針對商務(wù)網(wǎng)站提出商務(wù)管理模式,大大提高行業(yè)網(wǎng)站的商務(wù)應(yīng)用需求。 n 針對資訊網(wǎng)站分類目錄生成,提出用戶生成網(wǎng)站分類結(jié)構(gòu)。并可以實時增加與更新分類結(jié)構(gòu)。不受級數(shù)限制。從而大大利高行業(yè)的應(yīng)用性。 n 提供搜索引擎SEO優(yōu)化專業(yè)服務(wù),快速提高行業(yè)網(wǎng)站的推廣。 n 提供與CCDC呼叫搜索引擎的廣告合作。建立行業(yè)網(wǎng)站聯(lián)盟,提高行業(yè)網(wǎng)站知名度。 5) 網(wǎng)絡(luò)信息監(jiān)察與監(jiān)控 n 網(wǎng)絡(luò)輿情系統(tǒng)。如“千瓦通信-網(wǎng)絡(luò)輿情雷達監(jiān)測系統(tǒng)” n 網(wǎng)站信息與內(nèi)容監(jiān)察與監(jiān)控系統(tǒng),如“千瓦通信-網(wǎng)站信息與內(nèi)容監(jiān)測與監(jiān)察系統(tǒng)(站內(nèi)神探)”隨著因特網(wǎng)的迅猛發(fā)展、WEB信息的增加,用戶要在信息海洋里查找信息,就象大海撈 針一樣,搜索引擎技術(shù)恰好解決了這一難題(它可以為用戶提供信息檢索服務(wù))。目前, 搜索引擎技術(shù)正成為計算機工業(yè)界和學術(shù)界爭相研究、開發(fā)的對象。 搜索引擎(Search Engine)是隨著WEB信息的迅速增加,從1995年開始逐漸發(fā)展起來 的技術(shù)。據(jù)發(fā)表在《科學》雜志1999年7月的文章《WEB信息的可訪問性》估計,全球目前 的網(wǎng)頁超過8億,有效數(shù)據(jù)超過9T,并且仍以每4個月翻一番的速度增長。用戶要在如此浩 瀚的信息海洋里尋找信息,必然會 大海撈針 無功而返。搜索引擎正是為了解決這個 迷航 問題而出現(xiàn)的技術(shù)。搜索引擎以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)信息,對信息進行理解 、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的。搜索引擎提供 的導(dǎo)航服務(wù)已經(jīng)成為互聯(lián)網(wǎng)上非常重要的網(wǎng)絡(luò)服務(wù),搜索引擎站點也被美譽為 網(wǎng)絡(luò)門戶 。搜索引擎技術(shù)因而成為計算機工業(yè)界和學術(shù)界爭相研究、開發(fā)的對象。本文旨在對搜索 引擎的關(guān)鍵技術(shù)進行簡單的介紹,以起到拋磚引玉的作用。 分 類 按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類: 1.目錄式搜索引擎:以人工方式或半自動方式搜集信息,由編輯員查看信息之后,人 工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏 覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因為加入了人的智能,所以信息準確、導(dǎo)航質(zhì)量高 ,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。這類搜索引擎的代表是 :Yahoo、LookSmart、Open Directory、Go Guide等。 2.機器人搜索引擎:由一個稱為蜘蛛(Spider)的機器人程序以某種策略自動地在互 聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸 入檢索索引庫,并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁的全文檢索服務(wù)。該類搜 索引擎的優(yōu)點是信息量大、更新及時、毋需人工干預(yù),缺點是返回信息過多,有很多無關(guān) 信息,用戶必須從結(jié)果中進行篩選。這類搜索引擎的代表是:AltaVista、Northern Ligh t、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內(nèi)代表為: 天網(wǎng) 、悠游、O penFind等。 3.元搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請求同時向多個搜 索引擎遞交,將返回的結(jié)果進行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用 戶。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點是返回結(jié)果的信息量更大、更 全,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引 擎的代表是WebCrawler、InfoMarket等。 性 能 指 標 我們可以將WEB信息的搜索看作一個信息檢索問題,即在由WEB網(wǎng)頁組成的文檔庫中檢索 出與用戶查詢相關(guān)的文檔。所以我們可以用衡量傳統(tǒng)信息檢索系統(tǒng)的性能參數(shù)-召回率(R ecall)和精度(Pricision)衡量一個搜索引擎的性能。 召回率是檢索出的相關(guān)文檔數(shù)和文檔庫中所有的相關(guān)文檔數(shù)的比率,衡量的是檢索系 統(tǒng)(搜索引擎)的查全率;精度是檢索出的相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率,衡量 的是檢索系統(tǒng)(搜索引擎)的查準率。對于一個檢索系統(tǒng)來講,召回率和精度不可能兩全 其美:召回率高時,精度低,精度高時,召回率低。所以常常用11種召回率下11種精度的 平均值(即11點平均精度)來衡量一個檢索系統(tǒng)的精度。對于搜索引擎系統(tǒng)來講,因為沒 有一個搜索引擎系統(tǒng)能夠搜集到所有的WEB網(wǎng)頁,所以召回率很難計算。目前的搜索引擎系 統(tǒng)都非常關(guān)心精度。 影響一個搜索引擎系統(tǒng)的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢 的表示方法、評價文檔和用戶查詢相關(guān)性的匹配策略、查詢結(jié)果的排序方法和用戶進行相 關(guān)度反饋的機制。 主 要 技 術(shù) 一個搜索引擎由搜索器、索引器、檢索器和用戶接口等四個部分組成。 1.搜索器 搜索器的功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。它常常是一個計算機程序,日夜 不停地運行。它要盡可能多、盡可能快地搜集各種類型的新信息,同時因為互聯(lián)網(wǎng)上的信 息更新很快,所以還要定期更新已經(jīng)搜集過的舊信息,以避免死連接和無效連接。目前有 兩種搜集信息的策略: ● 從一個起始URL集合開始,順著這些URL中的超鏈(Hyperlink),以寬度優(yōu)先、深 度優(yōu)先或啟發(fā)式方式循環(huán)地在互聯(lián)網(wǎng)中發(fā)現(xiàn)信息。這些起始URL可以是任意的URL,但常常 是一些非常流行、包含很多鏈接的站點(如Yahoo?。?。 ● 將Web空間按照域名、IP地址或國家域名劃分,每個搜索器負責一個子空間的窮盡 搜索。 搜索器搜集的信息類型多種多樣,包括HTML、XML、Newsgroup文章、FTP文件、 字處理文檔、多媒體信息。 搜索器的實現(xiàn)常常用分布式、并行計算技術(shù),以提高信息 發(fā)現(xiàn)和更新的速度。商業(yè)搜索引擎的信息發(fā)現(xiàn)可以達到每天幾百萬網(wǎng)頁。 2.索引器 索引器的功能是理解搜索器所搜索的信息,從中抽取出索引項,用于表示文檔以及生 成文檔庫的索引表。 索引項有客觀索引項和內(nèi)容索引項兩種:客觀項與文檔的語意內(nèi)容無關(guān),如作者名、 URL、更新時間、編碼、長度、鏈接流行度(Link Popularity)等等;內(nèi)容索引項是用來 反映文檔內(nèi)容的,如關(guān)鍵詞及其權(quán)重、短語、單字等等。內(nèi)容索引項可以分為單索引項和 多索引項(或稱短語索引項)兩種。單索引項對于英文來講是英語單詞,比較容易提取, 因為單詞之間有天然的分隔符(空格);對于中文等連續(xù)書寫的語言,必須進行詞語的切 分。 在搜索引擎中,一般要給單索引項賦與一個權(quán)值,以表示該索引項對文檔的區(qū)分 度,同時用來計算查詢結(jié)果的相關(guān)度。使用的方法一般有統(tǒng)計法、信息論法和概率法。短 語索引項的提取方法有統(tǒng)計法、概率法和語言學法。 索引表一般使用某種形式的倒排表(Inversion List),即由索引項查找相應(yīng)的文檔 。索引表也可能要記錄索引項在文檔中出現(xiàn)的位置,以便檢索器計算索引項之間的相鄰或 接近關(guān)系(proximity)。 索引器可以使用集中式索引算法或分布式索引算法。當數(shù)據(jù)量很大時,必須實現(xiàn)即時 索引(Instant Indexing),否則不能夠跟上信息量急劇增加的速度。索引算法對索引器 的性能(如大規(guī)模峰值查詢時的響應(yīng)速度)有很大的影響。一個搜索引擎的有效性在很大 程度上取決于索引的質(zhì)量。 3.檢索器 檢索器的功能是根據(jù)用戶的查詢在索引庫中快速檢出文檔,進行文檔與 查詢的相關(guān)度評價,對將要輸出的結(jié)果進行排序,并實現(xiàn)某種用戶相關(guān)性反饋機制。 檢索器常用的信息檢索模型有集合理論模型、代數(shù)模型、概率模型和混合模型四種。 4.用戶接口 用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機制。主要的 目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時的信息。 用戶接口的設(shè)計和實現(xiàn)使用人機交互的理論和方法,以充分適應(yīng)人類的思維習慣。 用戶輸入接口可以分為簡單接口和復(fù)雜接口兩種。 簡單接口只提供用戶輸入查詢串的文本框;復(fù)雜接口可以讓用戶對查詢進行限制,如 邏輯運算(與、或、非;+、-)、相近關(guān)系(相鄰、NEAR)、域名范圍(如.edu、.com) 、出現(xiàn)位置(如標題、內(nèi)容)、信息時間、長度等等。目前一些公司和機構(gòu)正在考慮制定 查詢選項的標準。 未 來 動 向 搜索引擎已成為一個新的研究、開發(fā)領(lǐng)域。因為它要用到信息檢索、人工智能、計算 機網(wǎng)絡(luò)、分布式處理、數(shù)據(jù)庫、數(shù)據(jù)挖掘、數(shù)字圖書館、自然語言處理等多領(lǐng)域的理論和 技術(shù),所以具有綜合性和挑戰(zhàn)性。又由于搜索引擎有大量的用戶,有很好的經(jīng)濟價值,所 以引起了世界各國計算機科學界和信息產(chǎn)業(yè)界的高度關(guān)注,目前的研究、開發(fā)十分活躍, 并出現(xiàn)了很多值得注意的動向。 1.十分注意提高信息查詢結(jié)果的精度,提高檢索的有效性 用戶在搜索引擎上進行 信息查詢時,并不十分關(guān)注返回結(jié)果的多少,而是看結(jié)果是否和自己的需求吻合。對于一 個查詢,傳統(tǒng)的搜索引擎動輒返回幾十萬、幾百萬篇文檔,用戶不得不在結(jié)果中篩選。解 決查詢結(jié)果過多的現(xiàn)象目前出現(xiàn)了幾種方法:一是通過各種方法獲得用戶沒有在查詢語句 中表達出來的真正用途,包括使用智能代理跟蹤用戶檢索行為,分析用戶模型;使用相關(guān) 度反饋機制,使用戶告訴搜索引擎哪些文檔和自己的需求相關(guān)(及其相關(guān)的程度),哪些 不相關(guān),通過多次交互逐步求精。二是用正文分類(Text Categorization)技術(shù)將結(jié)果分 類,使用可視化技術(shù)顯示分類結(jié)構(gòu),用戶可以只瀏覽自己感興趣的類別。三是進行站點類 聚或內(nèi)容類聚,減少信息的總量。 2.基于智能代理的信息過濾和個性化服務(wù) 信息智能代理是另外一種利用互聯(lián)網(wǎng)信息的機制。它使用自動獲得的領(lǐng)域模型(如We b知識、信息處理、與用戶興趣相關(guān)的信息資源、領(lǐng)域組織結(jié)構(gòu))、用戶模型(如用戶背景 、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾) ,并自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有不斷學習、適 應(yīng)信息和用戶興趣動態(tài)變化的能力,從而提供個性化的服務(wù)。智能代理可以在用戶端進行 ,也可以在服務(wù)器端運行。 3.采用分布式體系結(jié)構(gòu)提高系統(tǒng)規(guī)模和性能 搜索引擎的實現(xiàn)可以采用集中式體系結(jié)構(gòu)和分布式體系結(jié)構(gòu),兩種方法各有千秋。但 當系統(tǒng)規(guī)模到達一定程度(如網(wǎng)頁數(shù)達到億級)時,必然要采用某種分布式方法,以提高 系統(tǒng)性能。搜索引擎的各個組成部分,除了用戶接口之外,都可以進行分布:搜索器可以 在多臺機器上相互合作、相互分工進行信息發(fā)現(xiàn),以提高信息發(fā)現(xiàn)和更新速度;索引器可 以將索引分布在不同的機器上,以減小索引對機器的要求;檢索器可以在不同的機器上四、怎么做搜索引擎優(yōu)化
什么是搜索引擎優(yōu)化? 搜索引擎優(yōu)化是指讓網(wǎng)站以友好的方式展示給搜索引擎,使自己網(wǎng)站的內(nèi)容很容易的被搜索引擎抓取和收錄。 那么怎么做才能友好的展示論壇內(nèi)容給搜索引擎呢? 首先,Discuz!論壇系統(tǒng)針對搜索引擎已經(jīng)做了大量的優(yōu)化,而站長只需要簡單的設(shè)置就能使自己的網(wǎng)站以友好的方式被搜索引擎收錄。 其次,”我的領(lǐng)地”針對搜索引擎已經(jīng)做了最重要一部分優(yōu)化工作。所以領(lǐng)主只需要根據(jù)以下幾條建議設(shè)置論壇,即可獲得各大搜索引擎的收錄和展示機會。第一,論壇保持一個較高的更新量,建議每天發(fā)表30-50條主題;為什么要把論壇的主題更新量放第一呢?因為搜索引擎會根據(jù)網(wǎng)站的內(nèi)容量和更新速度來選擇抓取時間間隔,例如小型的站點一般15天抓取一次,如果更新內(nèi)容量小更有可能30天抓取一次。時間間隔過大,就不能在第一時間將你的內(nèi)容提供給搜索引擎,讓它展示給更多用戶。第二,填寫Meta Description;Description是對一個網(wǎng)站概況的介紹,應(yīng)詳細的填寫論壇信息論壇內(nèi)容。如圖: (圖貼不上,上鏈接看吧:))搜索引擎收錄后會展示給用戶,例:如果沒有填寫收入信息如圖:第三,打開Archiver 功能,如圖:Archiver功能是Discuz!專門提供給搜索引擎的通道,強烈建議打開第四,允許游客瀏覽內(nèi)容;如果禁止游客瀏覽就等于禁止搜索引擎抓取內(nèi)容。這樣你的內(nèi)容就不會被收錄,禁止游客訪問是非常不友好的,如果沒有特殊的保密內(nèi)容,建議打開。第五,打開URL 靜態(tài)化;建議打開該功能,默認是開啟狀態(tài)第六,頭部附加信息---禁止放代碼;標題附加字是對搜索引擎優(yōu)化中最關(guān)鍵的地方,請務(wù)必填寫上利于你的論壇方向和定位的文字,不宜太多。標題附加字會體現(xiàn)在論壇的每一個頁面的 title 與 /title 之間,可以添加與你的論壇相關(guān)的熱門關(guān)鍵詞,以獲得良好的效果。 絕對不能添加任何程序代碼!否則搜索引擎以無效頁面不予收錄。第七,填寫Meta Keywords;Keywords是用來描述一個網(wǎng)頁的屬性,需要填寫與您論壇密切相關(guān)關(guān)鍵詞,而不是網(wǎng)頁的介紹。第八,與更多的站點互換友情鏈接;通過友情鏈接的互換,增加搜索引擎的入口。推薦與同類型的站點建立友情鏈接。第九,帖子內(nèi)容關(guān)鍵詞,附件關(guān)鍵詞盡可能的對帖子的附件進行描述,最好能將文件名與文件的描述加入主題內(nèi)容中。增加主題內(nèi)容的關(guān)鍵詞。即只有標題的論壇主題搜索引擎可能會判斷為無意義內(nèi)容。第十,給網(wǎng)站一個理性的定位和關(guān)鍵詞---在版塊介紹地方突出關(guān)鍵詞每個版塊都應(yīng)該有描述,描述能夠增加搜索引擎對論壇的了解和方便用戶查找信息。第十一,去搜索引擎查看自己站點的收錄情況,利用分析系統(tǒng)了解自己用戶來源和關(guān)注的熱點常去搜索引擎查看自己的論壇被收錄了多少,利用統(tǒng)計分析系統(tǒng)查看用戶所關(guān)注的熱點,能夠有效的了解關(guān)鍵詞,去做用戶更為關(guān)注和需要的服務(wù)。以上就是小編對于搜索引擎優(yōu)化開發(fā)服務(wù)_搜索引擎優(yōu)化實施問題和相關(guān)問題的解答了,搜索引擎優(yōu)化開發(fā)服務(wù)_搜索引擎優(yōu)化實施的問題希望對你有用!