伴隨著大數(shù)據(jù)應(yīng)用和人工智能的發(fā)展朦佩,相比傳統(tǒng)的線下市場(chǎng)研究分析冯遂,大數(shù)據(jù)使得企業(yè)能夠通過互聯(lián)網(wǎng)方便地獲取用戶的反饋信息更為廣泛拟枚。
云捷亮數(shù)主導(dǎo)的創(chuàng)新性市場(chǎng)研究,中國(guó)首創(chuàng)提出了通過“大小數(shù)據(jù)結(jié)合”的研究方式吼渡,為大數(shù)據(jù)的應(yīng)用能夠真正落地提供技術(shù)支撐和理論依據(jù)容为。這其中,隨著對(duì)用戶行為的了解的深入寺酪,云捷亮數(shù)的用戶標(biāo)簽化已經(jīng)能夠完美的抽象描繪出用戶信息全貌坎背。
為精準(zhǔn)地描述用戶特征,云捷亮數(shù)的社區(qū)標(biāo)簽從原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析寄雀,獲取事實(shí)標(biāo)簽沼瘫,進(jìn)行建模分析得到模型標(biāo)簽,再進(jìn)一步模型預(yù)測(cè)咙俩,得到預(yù)測(cè)標(biāo)簽;最后從宏觀層面總結(jié)湿故,完成具體的數(shù)據(jù)架構(gòu)阿趁。
不同的標(biāo)簽是用于區(qū)分用戶的重要程度,當(dāng)標(biāo)簽收集后坛猪,根據(jù)數(shù)據(jù)集的情況賦予標(biāo)簽相應(yīng)的權(quán)重脖阵。不同標(biāo)簽的來源用戶質(zhì)量、標(biāo)簽的傳遞路徑墅茉、轉(zhuǎn)發(fā)關(guān)系命黔、標(biāo)簽的本身以及標(biāo)簽與用戶之間的共現(xiàn)關(guān)系都會(huì)考慮在內(nèi)呜呐。
具體為:不同質(zhì)量的用戶自身產(chǎn)生的標(biāo)簽權(quán)重不甚相同。一般質(zhì)量越高悍募,該標(biāo)簽的可信度越高蘑辑;無論是將該標(biāo)簽賦予自身還是傳遞出去時(shí),其權(quán)重值越高坠宴;標(biāo)簽的傳遞路徑主要是針對(duì)基于關(guān)注關(guān)系的標(biāo)簽傳遞洋魂,親密度比較高的關(guān)注用戶傳遞過來的標(biāo)簽權(quán)重值會(huì)比較高。
如果標(biāo)簽本身是常見詞語(yǔ)喜鼓,那么用于刻畫用戶的興趣的區(qū)分性較差副砍;相反,如果是一個(gè)長(zhǎng)尾詞庄岖,則區(qū)分性較強(qiáng)豁翎。出于這樣的考慮,越是長(zhǎng)尾詞隅忿,標(biāo)簽的權(quán)重值會(huì)越高心剥。標(biāo)簽與用戶的共現(xiàn)關(guān)系是指用戶和該標(biāo)簽是否經(jīng)常共同出現(xiàn),評(píng)價(jià)的是兩者的關(guān)聯(lián)性硼控。關(guān)聯(lián)性越高刘陶,則標(biāo)簽的權(quán)重值越高。
綜上所述牢撼,一個(gè)標(biāo)簽對(duì)于特定用戶的權(quán)重值可以大致表示為:標(biāo)簽權(quán)重 = (來源因子 + 親密度因子 + 轉(zhuǎn)發(fā)因子 + 長(zhǎng)尾因子) × 共現(xiàn)因子匙隔。
云捷亮數(shù)會(huì)充分考量時(shí)間的變化因素,在標(biāo)簽權(quán)重值上疊加一個(gè)時(shí)間衰減函數(shù)熏版,這個(gè)時(shí)間衰減函數(shù)被設(shè)計(jì)成指數(shù)衰減的形式纷责,通過定義衰減幅度和半衰期,調(diào)節(jié)衰減的程度撼短,體現(xiàn)不同的時(shí)效性再膳。
在計(jì)劃構(gòu)建用戶標(biāo)簽化時(shí),云捷亮數(shù)能夠提供一個(gè)系統(tǒng)性曲横、框架性的思維指導(dǎo)喂柒。內(nèi)容地址、行為類型禾嫉、時(shí)間衰減灾杰,決定了權(quán)重模型是關(guān)鍵,權(quán)重值本身的二次建模則是水到渠成的進(jìn)階熙参。云捷亮數(shù)中國(guó)首創(chuàng)基于大數(shù)據(jù)和社區(qū)型研究的標(biāo)簽篩化技術(shù)艳吠,正在為創(chuàng)新性調(diào)研的發(fā)展提供堅(jiān)實(shí)的技術(shù)支撐。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? END
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 常永康
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?技術(shù)總監(jiān)
近20年以上技術(shù)開發(fā)經(jīng)驗(yàn)孽椰;曾任知名互聯(lián)網(wǎng)公司平臺(tái)開發(fā)負(fù)責(zé)人昭娩。分布式存儲(chǔ)和NoSQL數(shù)據(jù)庫(kù)技術(shù)(如MonogoDB凛篙、Redis、ElasticSearch等)專家栏渺,在深度學(xué)習(xí)呛梆、NLP、知識(shí)圖譜迈嘹、GAN等領(lǐng)域具有較為深厚的理論研究和實(shí)踐經(jīng)驗(yàn)削彬。