最近中文字幕完整视频高清1_国产高清免费的视频_女人一级毛片_亚洲一区二区三区首页

以求醫(yī)為例談搜索引擎排序算法的基礎(chǔ)原理

2023-10-22 未知 admin
以求醫(yī)為例談搜索引擎排序算法的基礎(chǔ)原理

我們向搜索引擎提交一個(gè)查詢,搜索引擎會(huì)從先到后列出大量的結(jié)果,這些結(jié)果排序的標(biāo)準(zhǔn)是什么呢?這個(gè)看似簡(jiǎn)單的問題,卻是信息檢索專家們研究的核心難題之一。

 

為了說(shuō)明這個(gè)問題,我們來(lái)研究一個(gè)比搜索引擎更加古老的話題:求醫(yī)。比如,如果我牙疼,應(yīng)該去看怎樣的醫(yī)生呢?假設(shè)我只有三種選擇:

  • A醫(yī)生,既治眼病,又治胃?。?/li>
  • B醫(yī)生,既治牙病,又治胃病,還治眼?。?/li>
  • C醫(yī)生,專治牙病。

A醫(yī)生肯定不在考慮之列。B醫(yī)生和C醫(yī)生之間,貌視更應(yīng)該選擇C醫(yī)生,因?yàn)樗鼘W?,更適合我的病情。假如再加一個(gè)條件:B醫(yī)生經(jīng)驗(yàn)豐富,有二十年從醫(yī)經(jīng)歷,醫(yī)術(shù)高明,而C醫(yī)生只有五年從醫(yī)經(jīng)驗(yàn),這個(gè)問題就不那么容易判斷了,是優(yōu)先選擇更加專注的C醫(yī)生,還是優(yōu)先選擇醫(yī)術(shù)更加高明的B醫(yī)生,的確成了一個(gè)需要仔細(xì)權(quán)衡的問題。

至少,我們得到了一個(gè)結(jié)論,擇醫(yī)需要考慮兩個(gè)條件:醫(yī)生的專長(zhǎng)與病情的適配程度;醫(yī)生的醫(yī)術(shù)。大家肯定覺得這個(gè)結(jié)論理所當(dāng)然,而且可以很自然地聯(lián)想到,搜索引擎排序不也是這樣嗎,既要考慮網(wǎng)頁(yè)內(nèi)容與用戶查詢的匹配程度,又要考慮網(wǎng)頁(yè)本身的質(zhì)量。但是,怎么把這兩種因素結(jié)合起來(lái),得到一個(gè),而不是兩個(gè)或多個(gè)排序標(biāo)準(zhǔn)呢?假如我們把這兩種因素表示成數(shù)值,最終的排序依據(jù)是把這兩個(gè)數(shù)值加起來(lái),還是乘起來(lái),或是按決策樹的辦法把它們組織起來(lái)?如果是加起來(lái),是簡(jiǎn)單相加,還是帶權(quán)重加呢?

我們可以根據(jù)直覺和經(jīng)驗(yàn),通過(guò)試錯(cuò)的辦法,把這兩個(gè)因素結(jié)合起來(lái)。但更好的辦法是我們能找到一個(gè)明確的依據(jù),最好能跟數(shù)學(xué)這樣堅(jiān)實(shí)的學(xué)科聯(lián)系起來(lái)。說(shuō)起來(lái),依據(jù)樸素的經(jīng)驗(yàn),人類在古代就能建造出高樓;但要建造出高達(dá)數(shù)百米的 摩天大廈,如果沒有建筑力學(xué)、材料力學(xué)這樣堅(jiān)實(shí)的學(xué)科作為后盾,則是非常非常困難的。同理,依據(jù)樸素的經(jīng)驗(yàn)構(gòu)建的搜索引擎算法,用來(lái)處理上萬(wàn)的網(wǎng)頁(yè)集合應(yīng)該是沒問題的;但要檢索上億的網(wǎng)頁(yè),則需要更為牢固的理論基礎(chǔ)。

求醫(yī),病人會(huì)優(yōu)先選擇診斷準(zhǔn)確、治療效果好的醫(yī)生;對(duì)于搜索引擎來(lái)說(shuō),一般按網(wǎng)頁(yè)滿足用戶需求的概率從大到小排序。如果用q表示用戶給出了一個(gè)特定的查詢,用d表示一個(gè)特定的網(wǎng)頁(yè)滿足了用戶的需求,那么排序的依據(jù)可以用一個(gè)條件概率來(lái)表示:

P(d|q)

這個(gè)簡(jiǎn)單的條件概率,將搜索引擎排序算法與概率論這門堅(jiān)實(shí)的學(xué)科聯(lián)系了起來(lái),這就像在大海中航行的船只裝備了指南針一樣。利用貝葉斯公式。

可以清楚地看到,搜索引擎的排序標(biāo)準(zhǔn),是由三個(gè)部分組成的:查詢本身的屬性P(q);網(wǎng)頁(yè)本身的屬性P(d);兩者的匹配關(guān)系P(q|d)。對(duì)于同一次查詢來(lái)說(shuō),所有網(wǎng)頁(yè)對(duì)應(yīng)的P(q)都是一樣的,因此排序時(shí)可以不考慮。

公式左邊,是已知用戶的查詢,求網(wǎng)頁(yè)滿足該用戶需求的概率。搜索引擎為了提高響應(yīng)用戶查詢的性能,需要事先對(duì)所有待查詢的網(wǎng)頁(yè)做預(yù)處理。預(yù)處理時(shí),只知道網(wǎng)頁(yè),不知道用戶查詢,因此需要倒過(guò)來(lái)計(jì)算,即分析每個(gè)網(wǎng)頁(yè)能滿足哪些需求,該網(wǎng)頁(yè)分了多大比例來(lái)滿足該需求,即得到公式右邊的第一項(xiàng)P(q|d),這相當(dāng)于上文介紹的醫(yī)生的專門程度。比如,一個(gè)網(wǎng)頁(yè)專門介紹牙病,另一個(gè)網(wǎng)頁(yè)既介紹牙病又介紹胃病,那么對(duì)于“牙疼”這個(gè)查詢來(lái)說(shuō),前一個(gè)網(wǎng)頁(yè)的P(q|d)值就會(huì)更高一些。

公式右邊的第二項(xiàng)P(d),是一個(gè)網(wǎng)頁(yè)滿足用戶需求的概率,它反映了網(wǎng)頁(yè)本身的好壞,與查詢無(wú)關(guān)。假如要向一個(gè)陌生人推薦網(wǎng)頁(yè)(我們并不知道他需要什么),那么P(d)就相當(dāng)于某個(gè)特定的網(wǎng)頁(yè)被推薦的概率。在傳統(tǒng)的信息檢索模型中,這一個(gè)量不太被重視,如傳統(tǒng)的向量空間模型、BM25模型,都試圖只根據(jù)查詢與文檔的匹配關(guān)系來(lái)得到排序的權(quán)重。而實(shí)際上,這個(gè)與查詢無(wú)關(guān)的量是非常重要的。假如我們用網(wǎng)頁(yè)被訪問的頻次來(lái)估計(jì)它滿足用戶需求的概率,可以看出對(duì)于兩個(gè)不同的網(wǎng)頁(yè),這個(gè)量有著極其巨大的差異:有的網(wǎng)頁(yè)每天只被訪問一兩次,而有的網(wǎng)頁(yè)每天被訪問成千上萬(wàn)次。能夠提供如此巨大差異的量,竟長(zhǎng)期被傳統(tǒng)的搜索引擎忽略,直到Google發(fā)明了pagerank并讓它參與到排序中。Pagerank是對(duì)P(d)值的一個(gè)不錯(cuò)的估計(jì),這個(gè)因素的加入使搜索引擎的效果立即上升到了一個(gè)新的臺(tái)階。

這個(gè)公式同樣回答了上文提出的問題,網(wǎng)頁(yè)與查詢的匹配程度,和網(wǎng)頁(yè)本身的好壞,這兩個(gè)因素應(yīng)該怎樣結(jié)合起來(lái)參與排序。這個(gè)公式以不可辯駁的理由告訴我們,如果網(wǎng)頁(yè)與查詢的匹配程度用P(q|d)來(lái)表示,網(wǎng)頁(yè)本身的好壞用P(d)來(lái)表示,那么應(yīng)該按它們的乘積來(lái)進(jìn)行排序。在現(xiàn)代商業(yè)搜索引擎中,需要考慮更多更細(xì)節(jié)的排序因素,這些因素可能有成百上千個(gè),要把它們?nèi)诤掀饋?lái)是更加復(fù)雜和困難的問題。

責(zé)任編輯:以求醫(yī)為例談搜索引擎排序算法的基礎(chǔ)原理

相關(guān)文章

樂天云培訓(xùn)中心

最近中文字幕完整视频高清1_国产高清免费的视频_女人一级毛片_亚洲一区二区三区首页

      9000px;">

          国产精品小仙女| 精品午夜久久福利影院| 国产性色一区二区| 91精品在线免费| 欧美亚洲日本国产| 日本乱人伦aⅴ精品| 成人高清免费在线播放| 国产综合久久久久久久久久久久 | 亚洲高清视频在线| 欧美高清在线一区| 欧美国产精品一区二区| 国产午夜亚洲精品羞羞网站| 日韩美女一区二区三区四区| 欧美一区二区在线播放| 欧美日韩一区二区三区四区五区| 欧美精品一区二区三区久久久| 日韩av网站在线观看| 亚洲欧美在线另类| 中文字幕在线视频一区| 日韩美女视频19| 亚洲老妇xxxxxx| 亚洲18色成人| 蜜臀国产一区二区三区在线播放| 精品国产乱码久久久久久图片| 精品一区二区国语对白| 日本不卡不码高清免费观看| 免费欧美在线视频| 国产美女视频一区| 99久久99久久久精品齐齐| 91色乱码一区二区三区| 在线不卡中文字幕| 久久久久久99精品| 亚洲欧美日韩系列| 偷拍一区二区三区| 国产精品一二三区在线| 99久久伊人精品| 欧美精品aⅴ在线视频| 欧美成人三级电影在线| 国产欧美中文在线| 亚洲午夜精品久久久久久久久| 久久人人爽爽爽人久久久| 久久久久久久国产精品影院| 亚洲桃色在线一区| 蜜桃免费网站一区二区三区| 成人国产精品免费网站| 欧美视频一区在线| 久久亚洲捆绑美女| 亚洲尤物视频在线| 国产不卡一区视频| 欧美日韩成人激情| 国产精品电影一区二区| 蜜臀av性久久久久蜜臀aⅴ | 一本久久a久久精品亚洲| 777a∨成人精品桃花网| 国产欧美日韩在线视频| 日韩成人精品在线| 在线观看日韩精品| 亚洲欧洲精品一区二区三区| 国产制服丝袜一区| 欧美区在线观看| 亚洲免费av高清| 国产不卡高清在线观看视频| 欧美va在线播放| 亚洲一区在线观看网站| 岛国一区二区三区| 久久久久久久av麻豆果冻| 日韩精品一区第一页| 在线观看日韩电影| 亚洲欧美激情插| av中文字幕一区| 中文字幕精品一区二区精品绿巨人| 日韩欧美的一区二区| 亚洲成人综合网站| 在线一区二区三区四区五区| 国产精品亲子伦对白| 国产一区二区免费在线| 日韩欧美在线观看一区二区三区| 精品欧美一区二区在线观看| 天堂一区二区在线| 欧美日韩视频在线第一区| 亚洲一区二区三区四区在线 | 欧美电视剧在线看免费| 亚洲第一成人在线| 欧美日韩久久久| 亚洲成人一区在线| 欧美高清视频一二三区| 日本欧美肥老太交大片| 日韩欧美在线影院| 久久99久久99精品免视看婷婷 | 色婷婷久久99综合精品jk白丝| 欧美亚洲综合网| 亚洲主播在线播放| 制服丝袜激情欧洲亚洲| 毛片av一区二区| 久久青草欧美一区二区三区| 国产一区二三区好的| 国产亚洲精品7777| 成人av在线网站| 尤物av一区二区| 欧美一区二区三区四区五区| 美女视频黄 久久| 26uuu国产电影一区二区| 国产69精品久久久久777| 中文字幕视频一区二区三区久| 日本欧美久久久久免费播放网| 从欧美一区二区三区| 国产精品久久久久影院老司| 一本高清dvd不卡在线观看| 图片区小说区区亚洲影院| 久久色.com| 色狠狠色噜噜噜综合网| 青青草国产精品亚洲专区无| 国产欧美日韩综合精品一区二区| 美腿丝袜亚洲三区| 日本一区二区不卡视频| 在线观看一区不卡| 国产在线视频不卡二| 一区二区三区在线播放| 欧美嫩在线观看| 不卡影院免费观看| 日韩国产欧美在线观看| 国产精品乱码久久久久久| 欧美精品xxxxbbbb| a美女胸又www黄视频久久| 日韩精品五月天| 国产精品国产三级国产a| 欧美日韩一卡二卡三卡| 成人午夜视频网站| 肉色丝袜一区二区| 亚洲婷婷综合色高清在线| 日韩午夜精品电影| 在线观看三级视频欧美| 成人福利视频网站| 精品一区二区三区免费视频| 一级精品视频在线观看宜春院 | 国产精品毛片久久久久久| 91麻豆福利精品推荐| 国产精品资源网| 秋霞午夜av一区二区三区| 国产精品久久久久久久久图文区 | 色诱视频网站一区| 秋霞影院一区二区| 亚洲视频中文字幕| 国产精品狼人久久影院观看方式| 成人美女在线观看| 狠狠色2019综合网| 韩日欧美一区二区三区| 日本视频在线一区| 日日骚欧美日韩| 午夜日韩在线观看| 亚洲一区二区偷拍精品| 一区二区久久久久| 亚洲欧美日韩国产综合| 国产亚洲午夜高清国产拍精品 | 粉嫩欧美一区二区三区高清影视| 久久日韩粉嫩一区二区三区| 欧美tk—视频vk| 欧美电视剧免费全集观看| 欧美日韩一区三区| 欧美日韩综合色| 欧美久久久久久久久中文字幕| 日韩av电影天堂| 一区免费观看视频| 欧美日本不卡视频| 99精品欧美一区二区三区小说| 日韩欧美中文一区| 日韩免费观看高清完整版在线观看| 久久国产婷婷国产香蕉| 热久久国产精品| 狠狠狠色丁香婷婷综合激情 | 国产午夜精品一区二区| 337p粉嫩大胆噜噜噜噜噜91av| 91视频在线看| 欧美久久一区二区| 2020日本不卡一区二区视频| 日韩欧美在线综合网| 国产亚洲一区二区三区四区| 亚洲人123区| 美女高潮久久久| 国产成人av电影在线播放| 成人福利视频网站| 欧美在线综合视频| 欧美一二三四在线| 欧美激情一区二区三区不卡| 国产精品成人免费| 日韩国产在线观看| a级高清视频欧美日韩| 91精品欧美一区二区三区综合在 | 麻豆91在线播放免费| 国产精品一区二区三区乱码| 91亚洲精华国产精华精华液| 欧美人体做爰大胆视频| 欧美电影免费提供在线观看| 久久精品视频免费观看| 亚洲电影在线免费观看| 国产成人精品一区二区三区网站观看| 日韩专区一卡二卡| 成人爽a毛片一区二区免费| 欧美亚洲动漫另类| 国产精品网曝门|