搜索是重中之重
隨著企業(yè)規(guī)模不斷擴(kuò)大,谷歌開始向多個(gè)領(lǐng)域進(jìn)軍,包括網(wǎng)絡(luò)地圖、數(shù)字圖書館、視頻共享以及桌面軟件等等。但是,谷歌的重中之重仍然是搜索引擎。通過谷歌搜索引擎,用戶可以在浩如煙海的大量信息中找到自己需要的內(nèi)容。正因?yàn)橛辛顺錾乃阉饕妫雀璨懦蔀榱嗽L問量最大、利潤最為豐厚、甚至最為強(qiáng)大的互聯(lián)網(wǎng)公司。
不過,搜索引擎給谷歌招致的抱怨也最多。每天都有數(shù)百萬用戶在使用谷歌搜索引擎之后感到失望,因?yàn)樗麄儫o法找到自己需要的旅館、醫(yī)藥處方、或者人物背景。谷歌經(jīng)常能幫助用戶找到想要的東西,但并非總能做到這一點(diǎn)。基于這一原因,阿米特·辛格哈爾(Amit Singhal)和其它數(shù)百名工程師一直致力于改進(jìn)谷歌搜索引擎,希望能縮小“經(jīng)常”和“總是”之間的差距。
互聯(lián)網(wǎng)的生命之源
辛格哈爾是谷歌搜索引擎排名算法的大師。這一算法主要用于確定哪些網(wǎng)頁是用戶問題的最佳答案,它是谷歌核心團(tuán)隊(duì)——搜索質(zhì)量部門的重要組成部分。長期以來,該部門一直是個(gè)謎,谷歌很少允許團(tuán)隊(duì)成員拋頭露面。谷歌對(duì)辛格哈爾及其團(tuán)隊(duì)的評(píng)價(jià)非常高,將他們視為公司最為根本的競(jìng)爭(zhēng)優(yōu)勢(shì)。谷歌認(rèn)為,要想抵御來自雅虎和微軟的強(qiáng)勢(shì)入侵,就必須降低讓用戶失望的頻度。而在這一過程中,搜索質(zhì)量部門發(fā)揮著不可替代的作用。
Federated Media首席執(zhí)行官約翰·巴特勒(John Battelle)表示:“谷歌創(chuàng)建的核心價(jià)值就是排名算法。”數(shù)據(jù)顯示,網(wǎng)絡(luò)商店有四分之一到二分之一的訪問者來自于搜索引擎;很多用戶都無視媒體網(wǎng)站的網(wǎng)頁,而是通過谷歌直接訪問所需的特定頁面。他說:“從上述事實(shí)可以看出,谷歌已經(jīng)成為了互聯(lián)網(wǎng)的‘生命之源’,誰也離不開它。”
用戶無法看到搜索引擎背后的算法和藝術(shù),但事實(shí)上,谷歌搜索質(zhì)量團(tuán)隊(duì)每周都要對(duì)搜索引擎算法做數(shù)次改進(jìn)。在他們的努力下,谷歌搜索引擎可以更加有效地理解用戶的真實(shí)意圖。例如,有些人搜索“蘋果”是為了了解同水果相關(guān)的信息,有些人則在研究蘋果公司的Mac或iPod。盡管搜索內(nèi)容相同,但用戶的意圖卻有著天壤之別。辛格哈爾表示:“過去幾年里,搜索已經(jīng)由‘給我輸入的東西’轉(zhuǎn)變?yōu)椤o我想要的東西’。”
不為人知的內(nèi)幕
辛格哈爾今年39歲,是一名印度人,于2000年加盟谷歌。他目前是一名谷歌研究員,這是谷歌專門為精英工程師設(shè)立的職位。不久前,一名《紐約時(shí)報(bào)》的記者獲準(zhǔn)采訪了辛格哈爾和其它搜索質(zhì)量團(tuán)隊(duì)成員。盡管谷歌對(duì)很多問題都諱莫如深,但這名記者仍然獲得了很多以前不為人知的內(nèi)幕。
在谷歌不斷改進(jìn)搜索引擎的過程中,面臨的最大挑戰(zhàn)是日漸龐大的規(guī)模。目前,谷歌已經(jīng)成為全球訪問量最大的網(wǎng)站,支持112種語言,將數(shù)百億個(gè)網(wǎng)頁納入索引,每天處理數(shù)億次搜索請(qǐng)求。更為糟糕的是,很多網(wǎng)頁創(chuàng)建的目的就是吸引眼球,里面充斥了大量的廣告、色情內(nèi)容和財(cái)務(wù)欺騙信息。因此,用戶希望谷歌能在搜索結(jié)果中排除這些無用網(wǎng)頁,幫助他們找到最相關(guān)的信息。
谷歌搜索質(zhì)量團(tuán)隊(duì)主管尤迪·馬恩伯(Udi Manber)表示:“用戶的期望值非常高。當(dāng)我們剛剛推出搜索服務(wù)時(shí),如果用戶能通過搜索引擎找到想要的東西,就會(huì)感到是一個(gè)奇跡。現(xiàn)在的情況則完全不同,如果用戶在前三個(gè)搜索結(jié)果頁面中找不到想要的東西,就認(rèn)為搜索引擎存在問題。”
谷歌搜索業(yè)務(wù)充分展現(xiàn)了其打破常規(guī)的管理模式。谷歌擁有數(shù)百名工程師,其中包括來自學(xué)術(shù)機(jī)構(gòu)的頂級(jí)搜索專家,這些人通常被松散地組織在一起,從事自己感興趣的項(xiàng)目。但在搜索引擎方面,谷歌會(huì)仔細(xì)、嚴(yán)格地檢查工程師的獨(dú)立成果,以確保新的搜索算法帶來的好處多于壞處。大多數(shù)情況下,改進(jìn)和質(zhì)量控制都涉及平衡的藝術(shù)。馬恩伯表示:“改進(jìn)總會(huì)同時(shí)帶來正面和負(fù)面的效應(yīng),我們必須衡量哪一種影響更大。只有正面效果,沒有負(fù)面效果的改進(jìn)不存在。”
搜索團(tuán)隊(duì)大揭秘
谷歌搜索質(zhì)量團(tuán)隊(duì)在谷歌辦公園區(qū)的43號(hào)樓(Building 43)工作。由于公司聯(lián)合創(chuàng)始人拉里·佩奇(Larry Page)向往太空旅行,一個(gè)與“太空船一號(hào)”同樣大小的復(fù)制品占據(jù)了43號(hào)樓的休息室。這一復(fù)制品也隨時(shí)提醒參觀者,谷歌就像火箭一樣迅速升起。辛格哈爾和其它三名頂級(jí)工程師的辦公室就坐落于43號(hào)樓的頂層,在他辦公桌附近的黑板上,到處涂滿了圖表、問題和數(shù)學(xué)公式,當(dāng)然還有用戶對(duì)谷歌引擎提出的各種意見。
谷歌的所有員工都可以使用“Buganizer”系統(tǒng)報(bào)告搜索問題,而辛格哈爾正是負(fù)責(zé)解決問題的人。辛格哈爾的同事馬特·卡茲(Matt Cutts)表示:“辛格哈爾收到他人提出的問題之后,總是視若珍寶,并努力通過修正算法解決問題。”有些時(shí)候,用戶或其它谷歌員工提出的問題需要立即得到解決。例如,如果不久前通過谷歌搜索“法國大革命”,就會(huì)出現(xiàn)大量與法國總統(tǒng)大選相關(guān)的信息,而不是打倒法國國王路易十六的那場(chǎng)革命。谷歌搜索質(zhì)量團(tuán)隊(duì)很快改變了網(wǎng)頁的權(quán)值,從而解決了這一問題。
當(dāng)然,有時(shí)會(huì)出現(xiàn)更為復(fù)雜的問題。2005年,谷歌產(chǎn)品經(jīng)理比爾·布羅格(Bill Brougher)指出,當(dāng)用戶搜索“teak patio Palo Alto”時(shí),并不會(huì)返回這家名叫“Teak Patio”的本地商店。辛格哈爾隨即啟動(dòng)了一項(xiàng)名為“Debug”的內(nèi)部計(jì)劃,檢查計(jì)算機(jī)系統(tǒng)對(duì)每一個(gè)查詢和網(wǎng)頁的評(píng)價(jià)。
辛格哈爾最終發(fā)現(xiàn),Theteakpatio.com之所以沒有在搜索結(jié)果中顯現(xiàn),主要因?yàn)楣雀杷阉魉惴ú]有賦予來自Palo Alto的其它網(wǎng)站足夠的權(quán)值。收到投訴后的兩個(gè)月內(nèi),辛格哈爾及其團(tuán)隊(duì)改進(jìn)了搜索算法,從而解決了相關(guān)問題。不過,辛格哈爾并不能匆忙地解決所有問題,因?yàn)樗阉饕娴拿恳淮握{(diào)整都會(huì)影響到很多網(wǎng)站。因此,他將很多問題都記在黑板上,如果同樣的問題再次出現(xiàn),他就會(huì)調(diào)整其優(yōu)先級(jí)。
人才是成功根本
為了提高搜索引擎的質(zhì)量,谷歌一直致力于從研究實(shí)驗(yàn)室和大學(xué)招募人才。例如,辛格哈爾就來自于AT&T實(shí)驗(yàn)室;馬恩伯最初曾經(jīng)在亞利桑那大學(xué)擔(dān)任計(jì)算機(jī)教員,隨后加盟雅虎擔(dān)任首席科學(xué)家,之后還曾運(yùn)營過亞馬遜搜索部門。他去年從亞馬遜加盟谷歌,很快就發(fā)現(xiàn)谷歌搜索引擎遙遙領(lǐng)先于學(xué)術(shù)實(shí)驗(yàn)室和其它企業(yè)競(jìng)爭(zhēng)對(duì)手。他回憶道:“加入谷歌后的前三個(gè)月里,我經(jīng)常會(huì)說,‘我有一個(gè)想法’。但他們總是告訴我,‘已經(jīng)有人提出過這個(gè)想法,它無法發(fā)揮作用’。”
谷歌搜索質(zhì)量團(tuán)隊(duì)的分工非常明確:辛格哈爾等工程師主要負(fù)責(zé)用戶輸入關(guān)鍵字后的系統(tǒng)處理;一部分人主要負(fù)責(zé)改進(jìn)搜索結(jié)果,例如優(yōu)化網(wǎng)站描述,讓用戶更容易了解一個(gè)網(wǎng)站的內(nèi)容;以馬恩伯為首的其它成員則主要負(fù)責(zé)維護(hù)龐大的網(wǎng)頁索引。在早期階段,谷歌每六到八周創(chuàng)建一個(gè)新索引,而現(xiàn)在該公司每隔幾天就要重新核對(duì)很多網(wǎng)頁。
在編輯索引的過程中,谷歌主要考慮每一個(gè)網(wǎng)頁的“PageRank”。PageRank是谷歌聯(lián)合創(chuàng)始人佩奇和塞吉·布林(Sergey Brin)的重要發(fā)明,它主要用于標(biāo)識(shí)其它網(wǎng)站鏈接到特定網(wǎng)頁的次數(shù)。網(wǎng)頁的PageRank越高,在搜索結(jié)果中的排名也就越高。辛格哈爾已經(jīng)開發(fā)出一個(gè)更為精確的系統(tǒng)來為網(wǎng)頁排名,它涉及了200多種信息,PageRank只是其中之一。
要完全了解谷歌搜索引擎所采用的技術(shù)是一項(xiàng)不可能完成的任務(wù),因?yàn)檫@是谷歌賴以成功的根本,同時(shí)也是其它競(jìng)爭(zhēng)對(duì)手夢(mèng)寐以求的東西。只從搜索結(jié)果來看,很多時(shí)候并不能看出谷歌搜索引擎與競(jìng)爭(zhēng)對(duì)手的差異。但搜索專家丹尼·沙利文(Danny Sullivan)認(rèn)為,谷歌仍然領(lǐng)先于競(jìng)爭(zhēng)對(duì)手。巴特勒也表示:“人們?nèi)匀徽J(rèn)為谷歌是搜索的黃金標(biāo)準(zhǔn)。”(馬丁)
安徽新華電腦學(xué)校專業(yè)職業(yè)規(guī)劃師為你提供更多幫助【在線咨詢】

熱門精品專業(yè)

