Python 擁有海量的包耕渴,無(wú)論是普通任務(wù)還是復(fù)雜任務(wù),我們經(jīng)常在應(yīng)用程序中使用大量的工具包爹橱。本文將討論一些常被低估的數(shù)據(jù)科學(xué)包萨螺,包括:數(shù)據(jù)清理、應(yīng)用程序開(kāi)發(fā)和調(diào)試方面愧驱。
1慰技、Faker
生產(chǎn)環(huán)境通常具有實(shí)時(shí)數(shù)據(jù)。把它放到測(cè)試環(huán)境中并不容易组砚。我們必須對(duì)從生產(chǎn)到測(cè)試環(huán)境的數(shù)據(jù)進(jìn)行標(biāo)記化吻商,這通常會(huì)將數(shù)據(jù)轉(zhuǎn)換為亂碼。
此外糟红,在欺詐行業(yè)艾帐,我們需要找出欺詐身份。為了生成假PII(個(gè)人可識(shí)別信息)盆偿,這里使用了一個(gè)名為Faker的包柒爸,這是一個(gè)很酷的軟件包,可以讓你創(chuàng)建一個(gè)帶有地址事扭、名字等的假PII捎稚。
以上是一些虛假數(shù)據(jù)的例子。帶有 GAN 假圖像的假數(shù)據(jù)可以給出一個(gè)真實(shí)的人。
2今野、Pywebio
我們知道 Flask 適用于 Python 端的表單葡公、UI 和 restapi。然而条霜,如果想要一個(gè)簡(jiǎn)單的表單催什,F(xiàn)lask就不太適用了。通常用 Pywebio 來(lái)創(chuàng)建宰睡,它會(huì)創(chuàng)建了一個(gè)簡(jiǎn)單蒲凶、干凈的UI。所有的代碼都是用普通的python編寫的拆内,并且我們不用額外學(xué)新東西豹爹!
在幾秒鐘內(nèi),它轉(zhuǎn)換為一個(gè)前端 UI 網(wǎng)頁(yè)矛纹。我們還可以編寫一些會(huì)話并處理輸入和輸出,查看他們的文檔以獲取詳細(xì)信息光稼。
3或南、Airflow
Airflow 它是一種工作流管理工具,在 MLOPS 中經(jīng)常被低估和較少使用艾君,它還可以用于特定的執(zhí)行間隔采够、重新訓(xùn)練模型、批處理冰垄、網(wǎng)站抓取蹬癌、投資組合跟蹤、自定義新聞提要等虹茶。
在工作流程方面逝薪,選項(xiàng)是無(wú)限的,它還可以連接到特定服務(wù)的云服務(wù)商蝴罪。代碼可以用 python 寫董济,在 UI 上可以看到執(zhí)行,非常棒要门。工作流也可以按特定時(shí)間間隔進(jìn)行安排虏肾。
4、 Loguru
Logger 是調(diào)試應(yīng)用程序的最佳方法之一欢搜。但是封豪,logger 里面的日志太多了,讓人比較煩炒瘟。而 Loguru 在某種程度上就比較友好吹埠,它雖不能解決所有挑戰(zhàn),但是它很容易添加日志語(yǔ)句并為其添加更多調(diào)試。
它還有助于拆分文件并執(zhí)行清理藻雌,因此我們不需要查看所有歷史日志雌续。
你還可以使用參數(shù) backtrace 來(lái)回溯執(zhí)行。
簡(jiǎn)而言之胯杭,在生產(chǎn)環(huán)境中使用這個(gè)包來(lái)調(diào)試應(yīng)用程序或 AI 模型訓(xùn)練是值得的驯杜。
5、Pydash
通常在數(shù)據(jù)清洗或處理中做个,我們要處理大量的數(shù)據(jù)清洗鸽心。這些是一些較小的項(xiàng)目,需要時(shí)間居暖。例如顽频,如何展平列表?當(dāng)然太闺,你可以寫一個(gè)清單糯景,但是如果有一個(gè)快速功能來(lái)執(zhí)行這些操作呢?
這就是Pydash閃耀的地方省骂,它成為了我的快速轉(zhuǎn)到庫(kù)蟀淮,其中包含一系列python實(shí)用程序。
以上只是一個(gè)小例子钞澳,它包含很多功能怠惶,絕對(duì)值得一看。
6轧粟、Weights & Biases
WANDB是跟蹤和可視化機(jī)器學(xué)習(xí)管道最有用的包之一策治,其中最喜歡的是central dashboard,它類似于記錄器兰吟,但可以做更多的事情通惫。
它易于使用,并集成了最流行的庫(kù)揽祥,如 Tensorflow讽膏、PyTorch、fastai拄丰、huggingface 等府树。但是,在商業(yè)領(lǐng)域使用它時(shí)有一些限制料按,必須付費(fèi)訂閱奄侠。除此之外,它是一個(gè)很棒的庫(kù)载矿。
7垄潮、PyCaret
PyCaret 包可以簡(jiǎn)化許多編碼烹卒,當(dāng)想快速做某件事情時(shí)可以使用。這個(gè)包有很多關(guān)于默認(rèn)參數(shù)的選項(xiàng)弯洗,可以用不同的度量點(diǎn)運(yùn)行不同的模型旅急。
總結(jié)
以上這些這不是一份詳盡的清單,如果大家有使用其他經(jīng)常未低估的軟件包牡整,可以在評(píng)論區(qū)一起分享交流哦藐吮!
如果文章對(duì)你有用的話,歡迎關(guān)注逃贝、點(diǎn)贊和收藏谣辞!