CreateML使用簡介

蘋果在去年推出了CoreML機器學習模型，今年在XCode10中提供的CreateML framework洞豁，可以創(chuàng)建CoreML模型绩蜻。

使用CreateML創(chuàng)建CoreML模型時蹲坷，僅需編寫少量的代碼。

準備工作

1惰爬、XCode10（目前是beta版本）

2、MacOS Mojave（目前也是beta版本）

3惫企、訓練數據：在同一個目錄下撕瞧，以文件夾作為分類，各個文件夾下存放對應分類的圖片

4狞尔、測試數據：和訓練數據一樣丛版，并且文件夾分類的名稱要和訓練數據的名稱一致

說明：

1、訓練數據可以自己準備偏序，也可以從網上找一些页畦，例如：Kaggle Cats and Dogs Dataset（本文是以Pets-100目錄下的圖片進行的訓練）

2、訓練數據數量越大研儒，訓練的模型越準確豫缨，訓練的時間也就越長

創(chuàng)建圖像分類CoreML模型

1、運行XCode10端朵，創(chuàng)建一個空的playground工程好芭，清除所有代碼，然后將下面的代碼拷貝在playground中

import CreateMLUI

let builder = MLImageClassifierBuilder()

builder.showInLiveView()

2冲呢、切換顯示XCode的assistant editor舍败，再點擊運行

MLImageClassifierBuilder的Live view

3、此時，XCode的assistant editor中邻薯，會顯示MLImageClassifierBuilder的live view裙戏，將訓練數據的目錄拖拽進來，XCode便開始訓練CoreML模型了

拖拽數據進行訓練

4弛说、將訓練后的模型挽懦，保存到文件

保存ML模型

保存的ML模型

5、應用創(chuàng)建的模型進行預測：將想要預測的圖片（或目錄）拖拽到模型上木人，進行預測信柿。例如，將Pets-1000目錄拖拽到Live view上醒第，預測的準確率如下

說明：除了在Live view中進行預測外渔嚷，也可以將保存后的模型導入到app中使用。參見Classifying Images with Vision and Core ML

應用模型進行預測

創(chuàng)建文本分類模型

創(chuàng)建文本分類ML模型稠曼，可以使用MLDataTable和MLTextClassifier類形病。步驟如下：

1、創(chuàng)建一個MLDataTable對象霞幅，讀取訓練數據（可以是JSON或CSV格式漠吻、或者Dictionary）

2、創(chuàng)建一個MLTextClassifier對象司恳，使用MLDataTable對象中的數據進行訓練

3途乃、通過MLTextClassifier對象的write(to:metadata:)方法，將模型保存到磁盤

csv文件格式示例：

title,author,pageCount,genre

Alice in Wonderland,Lewis Carroll,124,Fantasy

Hamlet,William Shakespeare,98,Drama

Treasure Island,Robert L. Stevenson,280,Adventure

Peter Pan,J. M. Barrie,94,Fantasy

JSON文件格式示例：

[

{

"title": "Alice in Wonderland",

"author": "Lewis Carroll",

"pageCount": 124,

"genre": "Fantasy"

},

{

"title": "Hamlet",

"author": "William Shakespeare",

"pageCount": 98,

"genre": "Drama"

}, ...

]

//Dictionary數據示例

let data: [String: MLDataValueConvertible] = [

??? "title": ["Alice in Wonderland", "Hamlet", "Treasure Island", "Peter Pan"],

??? "author": ["Lewis Carroll", "William Shakespeare", "Robert L. Stevenson", "J. M. Barrie"],

??? "pageCount": [124, 98, 280, 94],

??? "genre": ["Fantasy", "Drama", "Adventure", "Fantasy"]

]

let bookTable = try MLDataTable(dictionary: data)

示例代碼

在XCode創(chuàng)建一個空的playground工程扔傅，在資源中添加訓練使用的數據spam-sms.csv耍共，然后將下面的代碼粘貼到工程中

import Foundation

import CreateML

//獲取csv文件路徑

guard let trainingCSV = Bundle.main.url(forResource: "spam-sms", withExtension: "csv") else {

? ? fatalError()

}

//將csv文件內容加載到MLDataTable中

var spamData = try MLDataTable(contentsOf: trainingCSV)

let (trainingData, testData) = spamData.randomSplit(by: 0.8, seed: 0)

//創(chuàng)建文本分類器，進行訓練

//message和label分別對應csv文件中的短信內容列猎塞、短信標簽列

let predictor = try MLTextClassifier(trainingData: trainingData, textColumn: "message", labelColumn: "label")

//在測試數據集上驗證

let metrics = predictor.evaluation(on: testData)

工程示例：創(chuàng)建文本分類ML模型

說明：

使用400條中文短信內容的csv试读，訓練模型時，內存占用十分嚴重荠耽，超過Mac系統(tǒng)的物理內存钩骇，訓練卡在解析短信的步驟，未能訓練出模型铝量。

使用英文短信內容進行訓練時沐序，沒有內存問題瑞筐，可以訓練出模型。

其它

MLClassifier是一個通用的分類模型，MLRegressor是一個回歸模型恼蓬，給定訓練模型（MLDataTable）中的特征列和結果列后柠偶，就可以對這兩種模型進行訓練别伏。

缺點

模型訓練好后吐根，如果增加了數據集请梢，必須重新開始訓練，即無法在訓練好的模型上應用新的數據進行訓練力穗。

模型優(yōu)化

提高訓練數據集上的準確率（Training Accuracy）

對于MLImageClassifierBuilder毅弧，可以將訓練的迭代次數調整成20次

對于自然語言的分類器，可以嘗試不同的算法（MLTextClassifier.ModelAlgorithmType）

對于MLClassifier和MLRegressor当窗，則可以嘗試選用不同的模型進行訓練

提高驗證數據集上的準確率（Validation Accuracy）

對于擬合不足的問題够坐，可以通過增加訓練數據集來進行優(yōu)化。例如崖面，對于圖像分類器元咙，可以在訓練時勾選Augmentation（增加）選項：

Augmentation選項

對于過擬合的問題，則可以嘗試減少迭代次數進行優(yōu)化巫员。

提高測試數據集上的準確率（Evaluation Accuracy）

如果訓練數據集庶香、驗證數據集上的準確率，高于測試數據集上的準確率简识，原因通常是訓練數據和測試數據存在比較明顯的差異導致赶掖，這種情況下，可以嘗試在訓練數據集中使用更多的不同的數據七扰。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末奢赂，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子颈走，更是在濱河造成了極大的恐慌膳灶，老刑警劉巖，帶你破解...
沈念sama閱讀 216,402評論 6贊 499
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件疫鹊，死亡現場離奇詭異袖瞻，居然都是意外死亡司致，警方通過查閱死者的電腦和手機拆吆，發(fā)現死者居然都...
沈念sama閱讀 92,377評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來脂矫，“玉大人枣耀，你說我怎么就攤上這事⊥ピ伲” “怎么了捞奕？”我有些...
開封第一講書人閱讀 162,483評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長拄轻。經常有香客問我颅围，道長，這世上最難降的妖魔是什么恨搓？我笑而不...
開封第一講書人閱讀 58,165評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任院促，我火速辦了婚禮筏养，結果婚禮上，老公的妹妹穿的比我還像新娘常拓。我一直安慰自己渐溶，他們只是感情好，可當我...
茶點故事閱讀 67,176評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布弄抬。她就那樣靜靜地躺著茎辐，像睡著了一般。火紅的嫁衣襯著肌膚如雪掂恕。梳的紋絲不亂的頭發(fā)上拖陆，一...
開封第一講書人閱讀 51,146評論 1贊 297
城市分裂傳說
那天，我揣著相機與錄音竹海，去河邊找鬼慕蔚。笑死，一個胖子當著我的面吹牛斋配，可吹牛的內容都是我干的孔飒。我是一名探鬼主播，決...
沈念sama閱讀 40,032評論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼艰争，長吁一口氣：“原來是場噩夢啊……” “哼坏瞄！你這毒婦竟也來了？” 一聲冷哼從身側響起甩卓，我...
開封第一講書人閱讀 38,896評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤鸠匀，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后逾柿，有當地人在樹林里發(fā)現了一具尸體缀棍，經...
沈念sama閱讀 45,311評論 1贊 310
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,536評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年机错，在試婚紗的時候發(fā)現自己被綠了爬范。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,696評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡弱匪，死狀恐怖青瀑，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情萧诫，我是刑警寧澤斥难，帶...
沈念sama閱讀 35,413評論 5贊 343
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站帘饶，受9級特大地震影響哑诊，放射性物質發(fā)生泄漏。R本人自食惡果不足惜及刻，卻給世界環(huán)境...
茶點故事閱讀 41,008評論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一镀裤、第九天我趴在偏房一處隱蔽的房頂上張望穷当。院中可真熱鬧，春花似錦淹禾、人聲如沸馁菜。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評論 0贊 22
一樁弒父案铃岔，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽汪疮。三九已至，卻和暖如春毁习，著一層夾襖步出監(jiān)牢的瞬間智嚷，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,815評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工纺且，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留盏道，地道東北人。一個月前我還...
沈念sama閱讀 47,698評論 2贊 368
代替公主和親
正文我出身青樓载碌，卻偏偏與公主長得像猜嘱，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子嫁艇，可洞房花燭夜當晚...
茶點故事閱讀 44,592評論 2贊 353