一 OCR文字識別簡介 1.1 什么是OCR OCR (Optical Character Recognition,光學字符識別)是指電子設(shè)備(...
一 文本聚類簡介 1.1、定義 文本聚類主要是依據(jù)著名的聚類假設(shè):同類的文檔相似度較大,而不同類的文檔相似度較小。作為一種無監(jiān)督的機器學習方法伍俘,...
一声离、智能對話系統(tǒng)概述 1.1 什么是智能對話系統(tǒng) 所謂智能對話系統(tǒng)宾娜,簡單來說就是使用各種先進的機器學習带膜、深度學習吩谦、強化學習、遷移學習等智能算法膝藕,...
前言 作為NLP領(lǐng)域最經(jīng)典的使用場景之一式廷,文本分類積累了許多的實現(xiàn)方法。這里我們根據(jù)是否使用深度學習方法將文本分類主要分為一下兩個大類: 基于傳...
一 基本繪圖 1.1 turtle庫導入方法 import turtle --- 采用 turtle.<函數(shù)名>() 形式調(diào)用函數(shù)滑废。 f...
完整機器學習項目的流程 1 抽象成數(shù)學問題明確問題是進行機器學習的第一步。機器學習的訓練過程通常都是一件非常耗時的事情袜爪,胡亂嘗試時間成本是非常高...
1. 基于區(qū)域建議的目標檢測與識別算法 R-CNN(Selective Search + CNN + SVM) SPP-net(ROI Pool...
1. 分詞方法 中文分詞方法可以分為以下幾種:1) 基于統(tǒng)計的分詞方法 基于統(tǒng)計的分詞法的基本原理是根據(jù)字符串在語料庫中出現(xiàn)的統(tǒng)計頻率來決定其是...
初學Markdown,記錄下使用方法辛馆,便于查閱俺陋。 1. 標題級別設(shè)置(“#”號個數(shù)標定標題級別) 2. 列表(“- ”標定列表) 最后的格式:-...