
一、校驗(yàn)數(shù)字的表達(dá)式 數(shù)字:^[0-9]*$ n位的數(shù)字:^\d{n}$ 至少n位的數(shù)字:^\d{n,}$ m-n位的數(shù)字:^\d{m,n}$ ...
文本挖掘是從大量文本中,比如微博評(píng)論销睁,知乎評(píng)論枫虏,JD寨典,天貓?zhí)詫毚罅吭u(píng)論中的文本中抽取出有價(jià)值的知識(shí)颓帝,并利用這些知識(shí)創(chuàng)造出價(jià)值锻煌,實(shí)現(xiàn)變現(xiàn)的一個(gè)過程...
一受啥、PV、UV和IP的定義 PV: Page View鸽心,訪問量滚局。即頁(yè)面瀏覽量或點(diǎn)擊量,用戶每次刷新即被計(jì)算一次顽频。 UV:Unique Visi...
一藤肢、建立合適的索引 在常用過濾條件、表連接的字段建立索引糯景。但并不是所有索引對(duì)查詢都有效嘁圈,MySQL如果掃描數(shù)據(jù)超過30%省骂,都會(huì)走全表。 二最住、在w...
一钞澳、SVD介紹 在實(shí)際生活中,采集到的數(shù)據(jù)大部分信息都是無(wú)用的噪聲和冗余信息涨缚,為了剔除掉這些噪聲和無(wú)用的信息轧粟,只保留包含絕大部分重要信息的數(shù)據(jù)特...
一、降維介紹 降維是對(duì)數(shù)據(jù)高維度特征的一種預(yù)處理方法脓魏。降維是將高維度的數(shù)據(jù)保留下最重要的一些特征兰吟,去除噪聲和不重要的特征,從而實(shí)現(xiàn)提升數(shù)據(jù)處理速...
一茂翔、FP-growth介紹 從大規(guī)模的數(shù)據(jù)集中混蔼,尋找不同特征或者物品之間的隱含關(guān)系,稱為關(guān)聯(lián)分析(association analysis)珊燎,或...
一惭嚣、關(guān)聯(lián)分析介紹 商場(chǎng)的銷售過程,涉及很多機(jī)器學(xué)習(xí)的應(yīng)用悔政,商品的陳列料按,購(gòu)物卷的提供,用戶忠誠(chéng)度等等卓箫,通過對(duì)這些大量數(shù)據(jù)的分析,可以幫組商店了解用...
一垄潮、K-means聚類介紹 聚類是一種無(wú)監(jiān)督的學(xué)習(xí)烹卒,它將相似的對(duì)象歸到同一個(gè)簇中。它有點(diǎn)像全自動(dòng)分類 弯洗。聚類方法幾乎可以應(yīng)用于所有對(duì)象旅急,簇內(nèi)的對(duì)...