搜索廣告從用戶輸入query到展示廣告挤聘,主要流程可以大致分為以下幾個(gè)部分:
一、query分析
二邪媳、廣告檢索
三捐顷、廣告排序
四荡陷、點(diǎn)擊扣費(fèi)
在各種形式的廣告中雨效,搜索廣告由于有用戶表明自己意圖的輸入,因此通過對(duì)用戶輸入query的分析可以推薦相關(guān)性更高的廣告废赞,并且搜索廣告天生就具有原生廣告的特性徽龟,因此搜索廣告的效果一般來(lái)說是比較好的(點(diǎn)擊率、轉(zhuǎn)化率等)唉地。
比如用戶百度搜索“京東商城賣的貨是不是正品”据悔,則會(huì)出現(xiàn)如下搜索結(jié)果:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖1-1
首先大致分析一下整體的流程传透,系統(tǒng)分析用戶輸入的query,并提取相應(yīng)的關(guān)鍵詞极颓,如京東商城朱盐、正品等。然后根據(jù)提取的關(guān)鍵詞從廣告庫(kù)中進(jìn)行索引菠隆,還是以圖1-1舉例兵琳,由于京東公司買了“京東商城”的關(guān)鍵詞,并且系統(tǒng)判定京東公司所購(gòu)買關(guān)鍵詞所對(duì)應(yīng)的廣告和用戶搜索意圖具有相關(guān)性骇径,此時(shí)就可能會(huì)展示出京東商城的廣告(右上角有“商業(yè)推廣”的表示躯肌,這樣對(duì)于廣告不感興趣的用戶可以直接跳過該廣告,避免給廣告主帶來(lái)?yè)p失)破衔。
對(duì)于實(shí)際的搜索廣告的流程肯定比上面描述的復(fù)雜很多倍清女,那么下面就詳細(xì)的說明一下各個(gè)環(huán)節(jié)。
一晰筛、query分析
以電商網(wǎng)站中用戶的搜索來(lái)舉例嫡丙,用戶輸入的query表明了用戶的購(gòu)物意圖,因此電商網(wǎng)站會(huì)去分析用戶的購(gòu)物意圖读第,給其推薦符合其購(gòu)物興趣的商品迄沫。舉個(gè)例子,如果用戶在電商網(wǎng)站中輸入“斯伯丁籃球”卦方,如果此時(shí)返回的廣告中都是“李寧籃球”羊瘩、“安踏籃球”甚至“更過分”的給出了“足球”的廣告,那么這樣的點(diǎn)擊率肯定不會(huì)高的盼砍!點(diǎn)擊率不高尘吗,就算廣告主對(duì)于這個(gè)關(guān)鍵詞的出價(jià)再高,那么對(duì)于投放廣告的平臺(tái)的收入也不會(huì)太高浇坐。(搜索廣告行業(yè)的計(jì)費(fèi)方法一般都是沿用Google的方法睬捶,即收費(fèi)和點(diǎn)擊率、出價(jià)有關(guān)近刘,不同的公司會(huì)做一些調(diào)整擒贸,但大體是這個(gè)思路)。
由于query表明了用戶的購(gòu)物意圖觉渴,那么就需要分析用戶的購(gòu)物意圖介劫,query分析主要會(huì)做以下三件事:
1.query文本分析,總的來(lái)說就是分詞和對(duì)詞性的標(biāo)注
2.預(yù)測(cè)query對(duì)應(yīng)的三級(jí)類目以及每個(gè)類目的概率
3.品牌識(shí)別
query文本分析一般來(lái)說就是分詞和標(biāo)注詞性案淋,舉例來(lái)說座韵,如果用戶輸入“男士運(yùn)動(dòng)鞋”,那么系統(tǒng)會(huì)將用戶輸入的詞分為“男士”和“運(yùn)動(dòng)鞋”。
預(yù)測(cè)query對(duì)應(yīng)的三級(jí)類目以及每個(gè)類目的概率其實(shí)也很好理解誉碴,前面已經(jīng)說了分詞和詞性標(biāo)注宦棺,那么就可以根據(jù)分詞去預(yù)測(cè)這個(gè)商品會(huì)大致處于哪一個(gè)品類(商家在電商網(wǎng)站上發(fā)布商品時(shí)一般都需要填寫商品的類目屬性)。比如籃球在京東商城的一黔帕、二代咸、三級(jí)的分類為:運(yùn)動(dòng)戶外->體育用品->籃球,而籃球鞋在京東商城的一成黄、二侣背、三級(jí)的分類為:運(yùn)動(dòng)戶外->運(yùn)動(dòng)鞋包->籃球鞋。當(dāng)用戶輸入“斯伯丁籃球”時(shí)慨默,三級(jí)類目中籃球品類的概率(例:0.9)一定遠(yuǎn)高于籃球鞋品類的概率(例:0.1)贩耐。那么這又有什么影響呢?影響在于如果廣告主賣的是籃球鞋厦取,但是他買了“籃球”這個(gè)關(guān)鍵詞潮太,這時(shí)候也不一定會(huì)出他的廣告。這樣就能夠保證一定的相關(guān)性虾攻。
品牌識(shí)別主要的目的在于防止山寨產(chǎn)品铡买,例如用戶輸入“阿迪達(dá)斯”,那么如果廣告主賣的是“阿迪王”霎箍,這時(shí)候是肯定不能展現(xiàn)“阿迪王”的廣告的奇钞。(該策略的目的就是為了保證廣告的相關(guān)性,但如果廣告平臺(tái)想要更多的收入漂坏,就不一定不會(huì)采用這樣的策略景埃。在淘寶平臺(tái)上,用戶搜索“小米”或者“小米手機(jī)”顶别,很有可能會(huì)出vivo手機(jī)的廣告)
二谷徙、廣告檢索
廣告檢索是搜索廣告的比較重要的環(huán)節(jié),主要包括:查詢重寫驯绎、歸一化和檢索完慧。
查詢重寫(query rewrite)就是對(duì)于用戶輸入的一個(gè)原始查詢串,給出一堆和它相關(guān)聯(lián)的改寫串剩失。原因在于用戶輸入的詞不一定會(huì)有廣告主買這個(gè)詞屈尼,但是很有可能用戶輸入的詞和廣告主的買詞其實(shí)很相近(從廣告平臺(tái)的角度來(lái)看,可以理解為廣告平臺(tái)想要擴(kuò)大采買的流量)拴孤。比如說用戶輸入的query為“抗磨籃球”脾歧,那么廣告主買了“耐磨籃球”這個(gè)關(guān)鍵詞,從相關(guān)性的角度來(lái)說乞巧,其實(shí)也是可以向用戶進(jìn)行推薦廣告的涨椒。
總之镶骗,用戶搜索的query不一定能夠精確匹配到廣告主買詞懦尝,因此需要查詢重寫來(lái)增加一些詞來(lái)匹配到更多廣告主的買詞。
查詢重寫構(gòu)造新的關(guān)鍵詞的方式主要有如下幾種:精確匹配疆瑰、短語(yǔ)匹配是辕、切詞匹配等(不同的廣告平臺(tái)會(huì)有不同的匹配類型囤热,比如淘寶就只有廣泛匹配和精確匹配)。
如果用戶輸入的是“斯伯丁籃球”获三,那么精確匹配到的詞是“斯伯丁籃球”旁蔼。而短語(yǔ)匹配到的詞可以是“耐磨斯伯丁籃球”、“室外斯伯丁籃球”和“斯伯丁籃球7號(hào)”等疙教。
歸一化其實(shí)表示的是一個(gè)多對(duì)一的關(guān)系棺聊,由于用戶搜索詞千變?nèi)f化,不可能對(duì)所有的搜索詞建立到競(jìng)價(jià)廣告的倒排索引贞谓。因此就需要把多個(gè)意義相近的查詢?cè)~歸一化為同一個(gè)限佩。(可以拿一個(gè)現(xiàn)實(shí)中的例子來(lái)說明,平時(shí)我們量身高的尺子的精度只會(huì)到CM或者M(jìn)M裸弦,而實(shí)際上兩個(gè)同樣是175CM身高的人他們的真實(shí)身高也不會(huì)是一模一樣的)
歸一化能夠幫組減少搜索引擎需要處理詞的數(shù)量祟同,但同時(shí)也會(huì)喪失掉一些語(yǔ)義的精度。
檢索主要就是倒排索引和正排索引理疙,其中倒排索引是根據(jù)重寫后的關(guān)鍵詞去找到相應(yīng)的廣告晕城,而正排索引是根據(jù)找到的廣告去查詢廣告的詳細(xì)信息(推廣計(jì)劃、推廣單元窖贤、推廣創(chuàng)意等)砖顷。
檢索廣告時(shí),會(huì)對(duì)相關(guān)性不高的廣告進(jìn)行過濾赃梧。此時(shí)query分析的結(jié)果就派上了用場(chǎng)择吊,用分析得到的類目概率,去過濾掉那些相關(guān)性低的廣告槽奕。
廣告平臺(tái)的過濾規(guī)則一般不只有類目過濾几睛、品牌過濾≡猎埽可能還會(huì)有去判斷廣告文案(title)和廣告主買詞的相關(guān)性等等所森。
關(guān)于倒排和正排
還是舉例說明,假設(shè)所有網(wǎng)頁(yè)中可以寫入A或者空時(shí)夯接,如果用戶輸入關(guān)鍵詞A焕济,那么如果想要檢索哪個(gè)網(wǎng)頁(yè)中有A時(shí),此時(shí)需要檢索2次盔几。假設(shè)所有的網(wǎng)頁(yè)中可以寫入A晴弃,B或者為空,那么會(huì)有如下網(wǎng)頁(yè)信息的組合:空、A上鞠、B际邻、AB、BA芍阎。如果用戶輸入關(guān)鍵詞A世曾,那么如果逐個(gè)進(jìn)行檢索需要檢索5次。當(dāng)可以寫入的信息變多時(shí)谴咸,檢索的次數(shù)會(huì)以指數(shù)形式增加轮听。如果仍然以這種方式逐個(gè)檢索顯然是不現(xiàn)實(shí)的做法。因此就有了倒排索引岭佳,簡(jiǎn)單來(lái)說就是系統(tǒng)提前將一些關(guān)鍵詞從網(wǎng)頁(yè)(廣告)中提取出來(lái)血巍,并建立一個(gè)映射關(guān)系,這種方式就叫做倒排索引珊随。
正排就是根據(jù)找到的“序號(hào)”藻茂,去查網(wǎng)頁(yè)(廣告)的詳細(xì)信息。
三玫恳、廣告排序
在第二步中得到初步篩選的廣告隊(duì)列辨赐,還需要進(jìn)行其他更精細(xì)的過濾。比如要根據(jù)廣告本身的一些屬性去判斷是否能夠播該廣告京办,如投放地域的設(shè)置掀序、投放時(shí)間的設(shè)置等。
當(dāng)廣告經(jīng)過初篩和精篩惭婿,得到最終的廣告?zhèn)溥x庫(kù)不恭,會(huì)按照eCPM的方式進(jìn)行排序,即按照廣告出價(jià)和質(zhì)量分(質(zhì)量分反應(yīng)了廣告的“質(zhì)量”财饥,一般和廣告的點(diǎn)擊率换吧、廣告的創(chuàng)意,落地頁(yè)的質(zhì)量等等有關(guān)系)的乘積進(jìn)行排序钥星。排序得到的廣告隊(duì)列會(huì)被依次展示到網(wǎng)頁(yè)或者APP端的各個(gè)廣告位中沾瓦。
四、點(diǎn)擊扣費(fèi)
搜索廣告采用實(shí)時(shí)競(jìng)價(jià)的模式谦炒,每個(gè)廣告主可以對(duì)購(gòu)買的關(guān)鍵詞進(jìn)行出價(jià)贯莺,而扣費(fèi)是采用廣義第二高價(jià)(GSP)的扣費(fèi)方式,一般都采用eCPM的方式進(jìn)行排序:
eCPM排序:eCMP即期望最大收益eCPM = bidprice * eCTR^N宁改;由于搜索廣告是按照點(diǎn)擊扣費(fèi)缕探,因此扣費(fèi)時(shí)需將CPM轉(zhuǎn)成CPC:?
clickprice = bidprice(i) * [eCTR(i)^N / eCTR(i+1)^N]。
由于可能有的廣告平臺(tái)會(huì)存在移動(dòng)出價(jià)系數(shù)以及搜索人群溢價(jià)还蹲,在計(jì)算bidprice的時(shí)候就需要進(jìn)行換算爹耗,即
bidprice = ori_bidprice * 移動(dòng)出價(jià)系數(shù) * ( 1 + 人群溢價(jià)系數(shù))耙考。
公式中的N為價(jià)格擠壓因子,是一個(gè)大于0的數(shù)潭兽,價(jià)格擠壓因子的作用在于調(diào)節(jié)出價(jià)和點(diǎn)擊率在eCPM中排序的權(quán)重倦始。當(dāng)N趨近于0時(shí),此時(shí)決定排序的就是出價(jià)讼溺,而當(dāng)N趨近于無(wú)窮大時(shí)楣号,此時(shí)決定排序的就是eCTR最易。當(dāng)競(jìng)價(jià)激烈怒坯,廣告質(zhì)量不高時(shí),可以考慮提高價(jià)格擠壓因子藻懒,使得高質(zhì)量的廣告可以展現(xiàn)剔猿,當(dāng)競(jìng)爭(zhēng)不夠激烈,想提高廣告收入時(shí)可以考慮降低價(jià)格擠壓因子嬉荆。