需求背景
之前介紹了通過(guò)UiPath機(jī)器人爬取表格數(shù)據(jù)扼鞋,這里以網(wǎng)頁(yè)上的文字為例苇经,介紹使用UiPath機(jī)器人采集網(wǎng)頁(yè)信息并寫到文本文件中彰导。
UiPath的安裝和基本使用方法參見(jiàn)《如何免費(fèi)雇一個(gè)機(jī)器人爬蟲采集數(shù)據(jù)饲梭?》煌张。
詳細(xì)步驟
1. 打開(kāi)瀏覽器:將“Open Browser”拖動(dòng)至設(shè)計(jì)器面板中,填入需要打開(kāi)的網(wǎng)址:"https://www.uipath.com/product/studio"娃豹。按Ctrl + F6在瀏覽器中打開(kāi)網(wǎng)頁(yè)焚虱。
2. 加載網(wǎng)頁(yè):在“活動(dòng)”面板中,將“Get Visible Text”活動(dòng)添加到“Open Browser”活動(dòng)的“Do”容器中懂版。單擊“Indicate element inside browser”鹃栽,然后單擊要從先前加載的網(wǎng)頁(yè)中抓取的文本。
3. 抓取信息:在“Variables”面板中躯畴,創(chuàng)建一個(gè)名為“GetText”的新 string 變量民鼓,并將其作用域設(shè)置為 Sequence,用于存儲(chǔ)抓取的信息蓬抄。在“Get Visible Text”活動(dòng)的屬性面板中丰嘉,選擇“Text”屬性旁邊的字段,然后插入 GetText 變量嚷缭。
4. 打開(kāi)記事本文件:在項(xiàng)目中添加一個(gè)“Open Application”活動(dòng)饮亏,打開(kāi)記事本實(shí)例,單擊“Indicate window inside browser”阅爽,并選擇已打開(kāi)的應(yīng)用程序路幸。系統(tǒng)隨即會(huì)檢測(cè)記事本的文件路徑。
5. 寫入記事本文件: 在“Open Application”活動(dòng)的“Do”容器中添加一個(gè)“Type Into”活動(dòng)付翁。單擊“Indicate window inside browser”以選擇記事本窗口简肴,然后將“GetText” 變量添加到輸入文本字段中。此活動(dòng)可將抓取的文本寫入記事本窗口百侧。
6. 調(diào)試:按F6即可調(diào)試着帽,執(zhí)行過(guò)程中會(huì)打開(kāi)一個(gè)記事本并將抓取到的內(nèi)容輸入到記事本文件中。
7. 輸入法:由于不同電腦上的默認(rèn)輸入法不同移层,如果調(diào)式過(guò)程中出現(xiàn)輸入文本有錯(cuò)誤的情況,需要根據(jù)具體情況來(lái)調(diào)整一下赫粥。本人的默認(rèn)輸入法是搜狗中文观话,英文的輸入會(huì)有錯(cuò)誤。需要在輸入之前通過(guò)“Send Hotkey”來(lái)切換輸入法越平。另外频蛔,可以根據(jù)需要增加文本輸入灵迫,還可以點(diǎn)擊Text右邊的“+”號(hào)來(lái)增加回車鍵等特殊字符。這里輸入:GetText+"[k(enter)]"+“測(cè)試中文晦溪、符號(hào)和數(shù)字輸入:數(shù)值<=10”+ "[k(enter)]"瀑粥。
8. 執(zhí)行:執(zhí)行過(guò)程中打開(kāi)網(wǎng)頁(yè)和加載信息會(huì)有一些延時(shí),注意等待三圆。另外狞换,在執(zhí)行時(shí)最好關(guān)閉其他的網(wǎng)頁(yè)。
后續(xù)就可以根據(jù)需要執(zhí)行文本文件的自動(dòng)化處理了舟肉;此外修噪,采集信息或數(shù)據(jù)寫到其他格式的文件中的操作也是類似的。