數(shù)據(jù)建模API功能說明

優(yōu)劣勢分析

鏈接:http://47.92.89.223:8089/doc.html
使用建模工具API
能夠幫助我們做什么染簇?

優(yōu)勢

  • 統(tǒng)一整個數(shù)倉的字段命名
  • 沉淀行業(yè)常用字段名稱&標準詞根
  • 結合在線mapping文檔快速生成可執(zhí)行的DDL(建表)語句歉糜,幫助我們在創(chuàng)建模型表時提升我們的效率
  • 結合在線mapping文檔快速生成可執(zhí)行的DML()語句掘托,幫助我們在使用SQL開發(fā)模型時編碼規(guī)范,同樣能夠幫助我們在日常模型開發(fā)工作中進行效率提升(目前功能還需要完善)
  • 結合在線mapping文檔快速生成DQC()可執(zhí)行SQL語句辣辫,幫助我們提效(研發(fā)中)
  • 管理日常設計開發(fā)的數(shù)據(jù)模型佑钾,便于后期數(shù)據(jù)治理(研發(fā)中)

劣勢

  • 分詞翻譯準確率達不到100%沼本,能夠達到75%左右
  • 需要沉淀大量的各行業(yè)標準詞根
  • DML自動生成不能覆蓋100%場景的SQL和引擎

標準字段相關接口

標準字段生成

輸入 標準化字段中文注釋桂对,服務端返回標準字段英文字段名稱风题,該接口支持批量生成嘁扼。

接口位置

標準字段相關接口 ----> 標準字段生成

調(diào)用示例

假設你拿到一張表的數(shù)據(jù)字典宙橱,應該先對這張表的字段中文注釋進行標準化以至于翻譯出來的結果更加的準確捻悯,比如,我現(xiàn)在有一張表的數(shù)據(jù)字典鸟赫,如下:

  1. 第一步先將源表的字段中文注釋進行標準化蒜胖,如上圖左側

  2. 批量復制標準化后的字段中文注釋

  3. 找到 "標準字段相關接口 ----> 標準字段生成" 接口進行調(diào)試,然后將復制的需要生成的字段中文注釋粘貼到 text 對應的參數(shù)值 input框中惯疙,然后發(fā)送請求到服務端翠勉,稍等片刻等待服務端返回結果

  4. 將相應內(nèi)容中的數(shù)據(jù)復制到 excel 通過預先寫好的公式進行字符串按照 "|" 切割,取第三列值即可

標準字段生成(包含分詞)

輸入 標準化字段中文注釋霉颠,服務端返回分詞結果以及每個詞根對應的英文名稱&順序拼接后的字段英文名稱对碌,該接口支持批量生成。

接口位置

標準字段相關接口 ----> 標準字段生成(包含分詞)

調(diào)用示例

假設我們現(xiàn)在需要對 "是否評審" 這個字段生成標準的英文名稱蒿偎,那么我們只需要調(diào)用如下接口即可:

如上圖所示朽们,"是否評審" 這個中文注釋被分成了兩個詞怀读,"是否" + "評審" ,這兩個詞我們將它稱為 "標準詞根"骑脱,然后會將這兩個詞根對應的英文名稱進行順序拼接菜枷,如需要查詢標準詞根請使用 標準詞根查詢接口

自定義分詞演示

基于上述案例叁丧,如果我們需要自定義分詞方式啤誊,比如:"是否評審" 這個字段默認分成了 "是否" + "評審",現(xiàn)在我們需要自定義讓程序分成一個詞 "是否評審" 的話拥娄,這時候我們需要結合 "自定義數(shù)據(jù)元 ----> 用戶詞典插入" 接口完成蚊锹,具體操作方式如下:

插入成功數(shù)據(jù)元之后,我們再調(diào)用一次 "標準字段生成(包含分詞)" 接口稚瘾,看"是否評審" 這個數(shù)據(jù)元是否生效牡昆,如下圖:

如上圖我們發(fā)現(xiàn)已經(jīng)生效了,這時候分成了一個詞摊欠,但是英文字段名稱不一致丢烘,之前兩個詞時結果是 "is_review",而分成一個詞時結果是 "whthr_rvw" 是因為 "是否評審" 這個詞根的英文名稱是按照程序默認規(guī)則生成的些椒,不是那么的準確播瞳,所以我們需要對這個詞根進行評審,評審過后對該詞根進行修改摊沉,這時候需要調(diào)用 "標準詞根相關接口 ----> 修改詞根" 接口對 "是否評審" 詞根進行修改狐史,修改步驟如下:

修改完成之后痒给,我們再調(diào)用一次 "標準字段生成(包含分詞)" 接口说墨,結果如下:

如上圖所示就成功了,這樣我們就完成了一次 自定義分詞以及 詞根評審 流程苍柏。

修改標準字段

接口位置

標準字段相關接口 ----> 修改標準字段

調(diào)用示例

  1. 按照要求填寫接口入?yún)?/li>
  • chnsName:標準字段中文注釋
  • engName:標準字段英文名稱(評審過后)
  1. 發(fā)送請求至服務端
  2. 等待服務端返回結果尼斧,200代表更新成功,再次調(diào)用 "標準字段生成" 接口就是更新過后的英文名稱了试吁。

標準字段批量生成(偶爾使用)

TODO

表名&數(shù)據(jù)元&詞根&翻譯生成接口(廢棄)

TODO

模型表相關接口

模型DDL

該接口需要結合飛書在線文檔棺棵,輸入文檔URL鏈接和文檔sheet頁名稱,指定表引擎(目前支持gp熄捍、pg烛恤、hive引擎)

接口位置

模型表相關接口 ----> 模型DDL

調(diào)用示例

  1. 填寫飛書在線excel文檔的URL鏈接,以及模型表對應的sheet頁名稱余耽,并且指定表引擎
  2. 發(fā)送請求到服務端缚柏,這里注意有時候會因為飛書接口導致超時的錯誤,重新發(fā)送請求即可
  3. 等待片刻即可返回DDL語句

注意: 這里的飛書excel都是標準化過的碟贾,必須按照模版格式才能正確生成DDL

模型DML(僅支持Hive引擎)

接口位置

模型表相關接口 ----> 模型DML

調(diào)用示例

  1. 填寫飛書在線excel文檔的URL鏈接币喧,以及模型表對應的sheet頁名稱轨域,并且指定表引擎
  2. 發(fā)送請求到服務端,這里注意有時候會因為飛書接口導致超時的錯誤杀餐,重新發(fā)送請求即可
  3. 等待片刻即可返回DML語句干发,全選復制至數(shù)開平臺執(zhí)行即可

標準詞根相關接口

標準詞根查詢(經(jīng)常使用)

支持批量查詢,多個詞根之間使用 "空格符號" 進行分割史翘。

接口位置

標準詞根相關接口 ----> 查詢詞根

調(diào)用示例

  1. 在調(diào)式參數(shù)rootName對應的參數(shù)值輸入框輸入你想要生成的標準字段中文注釋枉长,如果需要生成多個標準字段可以使用空格符進行隔開即可,舉例:"是否 評審"
  2. 點擊發(fā)送請求按鈕
  3. 等待服務端返回結果即可琼讽,如遇到報錯請跟作者進行反饋

如上圖所示搀暑,接口返回結果的格式是 詞根中文名稱,詞根翻譯參考(多個參考|分隔),詞頻,詞根英文名稱

標準詞根更新(偶爾使用)

接口位置

標準詞根相關接口 ----> 修改詞根

調(diào)用示例

  1. 按照要求填寫接口入?yún)?
    • bsinssPlate:詞根所屬業(yè)務板塊
    • rootChnsNm:詞根中文名稱
    • rootNm:詞根英文名稱
    • translt:詞根翻譯參考
  2. 發(fā)送請求到服務端
  3. 等待服務端響應,200表示更新成功

詞根分頁查詢(基本不用)

接口位置

標準詞根相關接口 ----> 詞根分頁查詢

調(diào)用示例

  1. 按照要求填寫接口入?yún)?
    • page:第幾頁
    • pageSize:每一頁多少條數(shù)據(jù)
  2. 發(fā)送請求到服務端
  3. 等待服務端返回結果

詞根批量更新&新增(偶爾使用)

數(shù)據(jù)格式:詞根中文名稱,評審后的詞根英文名稱
數(shù)據(jù)文件格式:CSV

接口位置

標準詞根相關接口 ----> 詞根批量更新&新增

調(diào)用示例

需要使用PostMan或者curl方式調(diào)用

PostMan方式
curl方式

命令如下:

curl --location 'http://47.92.89.223:8089/root/batchUpdate' \
--header 'Cookie: JSESSIONID=808BBE4647F549AD95E7B6870D457760' \
--form 'csvFile=@"/Users/aochong/workHard/建模工具/詞根批量上傳測試.csv"'

自定義數(shù)據(jù)元相關接口

用戶詞典插入(偶爾使用)

接口位置

自定義數(shù)據(jù)元相關接口 ----> 用戶詞典插入

調(diào)用示例

  1. 按照要求填寫接口入?yún)?/li>
  2. 發(fā)送請求到服務端
  3. 等待服務端響應跨琳,msg = "OK" 說明插入成功了

用戶詞典更新(偶爾使用)

接口位置

自定義數(shù)據(jù)元相關接口 ----> 用戶詞典更新

調(diào)用示例

  1. 按照要求填寫入?yún)?
    • cstmDataElmnt:自定義數(shù)據(jù)元
    • partOfSpch:詞性
    • wordFrqncy:詞頻
  2. 發(fā)送請求到服務端
  3. 等待服務端返回結果自点,狀態(tài) 200 說明更新成功了

用戶詞典分頁查詢(基本不使用)

接口位置

自定義數(shù)據(jù)元相關接口 ----> 用戶詞典分頁查詢

調(diào)用示例

  1. 按照要求填寫接口入?yún)?
    • page:第幾頁
    • pageSize:每一頁多少條數(shù)據(jù)
  2. 發(fā)送請求到服務端
  3. 等待服務端返回結果

單條用戶詞典查詢(偶爾使用)

接口位置

自定義數(shù)據(jù)元相關接口 ----> 單條用戶詞典查詢

調(diào)用示例

  1. 按照要求填寫接口入?yún)?
    • cstmDataElmnt:自定義數(shù)據(jù)元
  2. 發(fā)送請求到服務端
  3. 等待服務端返回結果
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市脉让,隨后出現(xiàn)的幾起案子桂敛,更是在濱河造成了極大的恐慌,老刑警劉巖溅潜,帶你破解...
    沈念sama閱讀 221,576評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件术唬,死亡現(xiàn)場離奇詭異,居然都是意外死亡滚澜,警方通過查閱死者的電腦和手機粗仓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,515評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來设捐,“玉大人借浊,你說我怎么就攤上這事÷苷校” “怎么了蚂斤?”我有些...
    開封第一講書人閱讀 168,017評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長槐沼。 經(jīng)常有香客問我曙蒸,道長,這世上最難降的妖魔是什么岗钩? 我笑而不...
    開封第一講書人閱讀 59,626評論 1 296
  • 正文 為了忘掉前任纽窟,我火速辦了婚禮,結果婚禮上兼吓,老公的妹妹穿的比我還像新娘臂港。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 68,625評論 6 397
  • 文/花漫 我一把揭開白布趋艘。 她就那樣靜靜地躺著疲恢,像睡著了一般。 火紅的嫁衣襯著肌膚如雪瓷胧。 梳的紋絲不亂的頭發(fā)上显拳,一...
    開封第一講書人閱讀 52,255評論 1 308
  • 那天,我揣著相機與錄音搓萧,去河邊找鬼杂数。 笑死,一個胖子當著我的面吹牛瘸洛,可吹牛的內(nèi)容都是我干的揍移。 我是一名探鬼主播,決...
    沈念sama閱讀 40,825評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼反肋,長吁一口氣:“原來是場噩夢啊……” “哼那伐!你這毒婦竟也來了?” 一聲冷哼從身側響起石蔗,我...
    開封第一講書人閱讀 39,729評論 0 276
  • 序言:老撾萬榮一對情侶失蹤罕邀,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后养距,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體诉探,經(jīng)...
    沈念sama閱讀 46,271評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,363評論 3 340
  • 正文 我和宋清朗相戀三年棍厌,在試婚紗的時候發(fā)現(xiàn)自己被綠了肾胯。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,498評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡耘纱,死狀恐怖敬肚,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情揣炕,我是刑警寧澤帘皿,帶...
    沈念sama閱讀 36,183評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站畸陡,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏虽填。R本人自食惡果不足惜丁恭,卻給世界環(huán)境...
    茶點故事閱讀 41,867評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望斋日。 院中可真熱鬧牲览,春花似錦、人聲如沸恶守。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,338評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至庸毫,卻和暖如春仔拟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背飒赃。 一陣腳步聲響...
    開封第一講書人閱讀 33,458評論 1 272
  • 我被黑心中介騙來泰國打工利花, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人载佳。 一個月前我還...
    沈念sama閱讀 48,906評論 3 376
  • 正文 我出身青樓炒事,卻偏偏與公主長得像,于是被迫代替她去往敵國和親蔫慧。 傳聞我的和親對象是個殘疾皇子挠乳,可洞房花燭夜當晚...
    茶點故事閱讀 45,507評論 2 359

推薦閱讀更多精彩內(nèi)容