11
0
2
1055
hadoop生態(tài)圈:分布式存儲-hdfs兜蠕;分布式批處理-mapreduce 將大量數(shù)據(jù)進行處理莱预,獲取我們需要的有價值的信息 弊端:頻繁的寫磁盤;...
1)對于某個文檔進行分句 2)對于每個分句使用Word2Vec等工具進行向量化(Word Embedding)涨颜, 3)將句子中的每個詞或詞組的W...