24種用于機器學(xué)習(xí)的最佳電子商務(wù)和零售數(shù)據(jù)集

一晌缘、機器學(xué)習(xí)的產(chǎn)品數(shù)據(jù)集

  1. Fashion-MNIST:MNIST非常適合產(chǎn)品分類用例,其中包含10個類別的近60,000張時尚產(chǎn)品的訓(xùn)練圖像和10,000張測試圖像痢站。

    https://github.com/zalandoresearch/fashion-mnist

  2. 來自“維多利亞的秘密”和其他雜志的內(nèi)衣數(shù)據(jù):來自流行零售網(wǎng)站的600,000多種內(nèi)衣產(chǎn)品數(shù)據(jù)磷箕。它包括產(chǎn)品說明,價格阵难,類別岳枷,評級等。

    https://www.kaggle.com/PromptCloudHQ/innerwear-data-from-victorias-secret-and-others

  3. 電子產(chǎn)品和定價數(shù)據(jù):此數(shù)據(jù)集包含7,000多種電子產(chǎn)品的列表以及10個價格信息字段呜叫。

    https://data.world/datafiniti/electronic-products-and-pricing-data

  4. 男鞋價格:10,000張男鞋的清單以及各種售價空繁。

    https://data.world/datafiniti/mens-shoe-prices

  5. 女鞋價格:除了以前的數(shù)據(jù)集之外,它還包含10,000種女鞋的列表以及各種售價朱庆。

    https://data.world/datafiniti/womens-shoe-prices

  6. 電子商務(wù)商品數(shù)據(jù):對于推薦系統(tǒng)很有用盛泡,該數(shù)據(jù)集包含SKU及其來自戶外服裝品牌產(chǎn)品目錄的相關(guān)產(chǎn)品描述。

    https://www.kaggle.com/cclark/product-item-data/home

  7. Amazon.com上的Fashion Products:這是通過從Amazon提取數(shù)據(jù)而創(chuàng)建的預(yù)抓取數(shù)據(jù)集娱颊。它由亞馬遜上約22,000種時尚產(chǎn)品組成傲诵。

    https://data.world/promptcloud/fashion-products-on-amazon-com

  8. 服裝的電子商務(wù)標(biāo)簽:此零售數(shù)據(jù)集包含來自電子商務(wù)網(wǎng)站的圖像,在襯衫箱硕,夾克拴竹,太陽鏡等周圍畫有邊框。它有907個項目剧罩,其中504個項目已手動標(biāo)記栓拜。

    https://dataturks.com/projects/devika.mishra/E-commerce%20Tagging%20for%20clothing

二、機器學(xué)習(xí)的零售交易數(shù)據(jù)集

  1. 在線零售數(shù)據(jù)集(UCI機器學(xué)習(xí)存儲庫):此數(shù)據(jù)集包含一個總部位于英國的在線零售公司在八個月內(nèi)(01/12 / 2010-09 / 12/2011)的所有交易。

    https://www.kaggle.com/carrie1/ecommerce-data/home

  2. 巴西電子商務(wù)公共數(shù)據(jù)集:此數(shù)據(jù)集包含2016年至2018年在多個市場在Olist上做出的100,000多個巴西匿名訂單(100k訂單)幕与。此外挑势,它包括從訂單狀態(tài),價格纽门,付款和貨運績效到客戶的真實書面評論的多個維度薛耻。

    https://www.kaggle.com/olistbr/brazilian-ecommerce/home

  3. Online Auctions數(shù)據(jù)集:零售數(shù)據(jù)集,其中包含Cartier手表赏陵,Xbox游戲機饼齿,Palm Pilot M515 PDA和Swarovski珠子上的eBay拍賣數(shù)據(jù)。

    https://www.kaggle.com/onlineauctions/online-auctions-dataset/home

  4. Retailrocket推薦系統(tǒng)數(shù)據(jù)集:此數(shù)據(jù)是在4.5個月的時間內(nèi)從真實的電子商務(wù)網(wǎng)站收集的蝙搔。此外缕溉,它還包含有關(guān)訪客行為的信息,包括點擊吃型,添加到購物車和交易等事件证鸥。

    https://www.kaggle.com/retailrocket/ecommerce-dataset/home

三、機器學(xué)習(xí)的電子商務(wù)搜索相關(guān)性數(shù)據(jù)集

  1. 電子商務(wù)搜索相關(guān)性:此集合包含圖像URL勤晚,頁面排名枉层,每種產(chǎn)品的描述,導(dǎo)致每種結(jié)果的搜索查詢以及來自五個主要英語電子商務(wù)網(wǎng)站的更多信息赐写。

    https://data.world/crowdflower/ecommerce-search-relevance

  2. 百思買搜索查詢NER數(shù)據(jù)集:零售數(shù)據(jù)集鸟蜡,包含在bestbuy.com上帶有手動標(biāo)記的搜索查詢。搜索查詢中的短語被標(biāo)記為各種重要實體挺邀,例如品牌揉忘,型號名稱,類別名稱等端铛。

    https://dataturks.com/projects/Mohan/Best%20Buy%20E-commerce%20NER%20dataset

四泣矛、用于機器學(xué)習(xí)的客戶審查數(shù)據(jù)集

  1. 女士電子商務(wù)服裝評論:另一個電子商務(wù)數(shù)據(jù)的絕佳資源,此Kaggle數(shù)據(jù)集包含23,000個真實的客戶評論和評分禾蚕。但是您朽,由于其特征是真實的商業(yè)數(shù)據(jù),因此所有信息都已匿名化换淆。因此虚倒,在評論文本和正文中對公司的引用已被替換為“零售商”。

    https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews/home

  2. Amazon Commerce評論集:此零售數(shù)據(jù)集用于在線Writeprint中的作者身份識別产舞,Writeprint是模式識別的新研究領(lǐng)域。此外菠剩,為了檢查分類算法的魯棒性易猫,我們確定了50個最頻繁發(fā)布評論的最活躍用戶。

    https://archive.ics.uci.edu/ml/datasets/Amazon+Commerce+reviews+set

  3. 多域情感分析數(shù)據(jù)集:稍舊的零售數(shù)據(jù)集具壮,其中包含按產(chǎn)品類型和等級劃分的產(chǎn)品評論數(shù)據(jù)准颓。此外哈蝇,評論包含星級(1到5顆星),可以根據(jù)需要將其轉(zhuǎn)換為二進制標(biāo)簽攘已。

    http://www.cs.jhu.edu/~mdredze/datasets/sentiment/

  4. 亞馬遜和百思買電子:來自50種電子產(chǎn)品的7,000多個在線評論列表炮赦。除了評論本身之外,數(shù)據(jù)集還包括日期样勃,來源吠勘,等級,標(biāo)題峡眶,評論者元數(shù)據(jù)等剧防。

    https://data.world/datafiniti/amazon-and-best-buy-electronics

  5. 語法和在線產(chǎn)品評論:這是Datafiniti的一個大型數(shù)據(jù)集的示例。它包含超過70,000條評論的列表辫樱,可用于許多機器學(xué)習(xí)用例峭拘。例如,您可以評估寫作質(zhì)量如何影響正面和負面的在線產(chǎn)品評論狮暑。

    https://data.world/datafiniti/grammar-and-online-product-reviews

  6. 機器學(xué)習(xí)的電子商務(wù)數(shù)據(jù)集

    年度零售貿(mào)易調(diào)查(ARTS):此數(shù)據(jù)集提供了在美國境外持有的年度總銷售鸡挠,運營費用和庫存的國家估計。

    https://catalog.data.gov/dataset/annual-retail-trade-survey

  7. 經(jīng)濟普查:經(jīng)濟普查每五年對國家和地方一級的行業(yè)和社區(qū)的商業(yè)活動進行詳細描述搬男。

    https://catalog.data.gov/dataset/economic-census

  8. E-Stats:美國政府的該數(shù)據(jù)集報告了無論通過開放式網(wǎng)絡(luò)(例如Internet)在線銷售的商品和服務(wù)的價值拣展。

    https://catalog.data.gov/dataset/e-stats

  9. 歐盟對外貿(mào)易數(shù)據(jù)集:另一個政府?dāng)?shù)據(jù)集,歐盟對外貿(mào)易數(shù)據(jù)集提供有關(guān)按商品止后,按原產(chǎn)國或目的地分類的進出口瞎惫,貿(mào)易順差值的信息。

    https://ec.europa.eu/eurostat/web/international-trade-in-goods/data

  10. 1999-2015年按商品類別劃分的電子商務(wù)銷售額:此數(shù)據(jù)集包含真實的普查數(shù)據(jù)译株,該數(shù)據(jù)顯示了按商品類別劃分的電子商務(wù)總銷售額以及1999-2015年的復(fù)合年增長率瓜喇。

    https://www.census.gov/data/tables/2015/econ/e-stats/2015-e-stats.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市歉糜,隨后出現(xiàn)的幾起案子乘寒,更是在濱河造成了極大的恐慌,老刑警劉巖匪补,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件伞辛,死亡現(xiàn)場離奇詭異,居然都是意外死亡夯缺,警方通過查閱死者的電腦和手機蚤氏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來踊兜,“玉大人竿滨,你說我怎么就攤上這事。” “怎么了于游?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵毁葱,是天一觀的道長。 經(jīng)常有香客問我贰剥,道長倾剿,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任蚌成,我火速辦了婚禮前痘,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘笑陈。我一直安慰自己际度,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布涵妥。 她就那樣靜靜地躺著乖菱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪窒所。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天帆锋,我揣著相機與錄音吵取,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛摄乒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼笼恰,長吁一口氣:“原來是場噩夢啊……” “哼逼龟!你這毒婦竟也來了翎碑?” 一聲冷哼從身側(cè)響起日杈,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后藕甩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡骤素,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年送浊,在試婚紗的時候發(fā)現(xiàn)自己被綠了与殃。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡钻弄,死狀恐怖佃却,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情窘俺,我是刑警寧澤饲帅,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站瘤泪,受9級特大地震影響灶泵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜对途,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一赦邻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧实檀,春花似錦惶洲、人聲如沸按声。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽签则。三九已至,卻和暖如春铐料,著一層夾襖步出監(jiān)牢的瞬間怀愧,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工余赢, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人哈垢。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓妻柒,卻偏偏與公主長得像,于是被迫代替她去往敵國和親耘分。 傳聞我的和親對象是個殘疾皇子举塔,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容