內(nèi)容審核:中國GPT醫(yī)生面臨困境户秤,怎么保障信息的“安全流通”码秉?

醫(yī)學領(lǐng)域大語言模型發(fā)展迅速。谷歌的Med-PaLM鸡号、升級版Med-PaLM 2转砖,在醫(yī)學問題回答上表現(xiàn)卓越。國內(nèi)醫(yī)聯(lián)推出的MedGPT基于Transformer架構(gòu)鲸伴,通過多輪問診提升診斷準確性府蔗,能覆蓋多種疾病,實現(xiàn)全流程智能化診療汞窗。這些模型不僅提升了醫(yī)療服務的效率與準確性姓赤,還展示了AI在醫(yī)學領(lǐng)域的巨大潛力。

一仲吏、引言

隨著大模型逐漸在AI世界占據(jù)主導不铆,更多人意識到數(shù)據(jù)的重要性,甚至有業(yè)內(nèi)人士稱其為人工智能的“護城河”裹唆。以ChatGPT為例狂男,它雖然可以快速、多角度回答問題品腹,但在沒受過訓練的情況下岖食,無法很好地勝任健康咨詢的任務∥杩裕可是泡垃,在醫(yī)學領(lǐng)域析珊,大模型對數(shù)據(jù)的需求,往往可能會觸及到病人的隱私問題蔑穴、醫(yī)院的數(shù)據(jù)安全等忠寻。

2023年,一份發(fā)表在權(quán)威期刊上的試驗結(jié)果顯示存和,ChatGPT在根據(jù)現(xiàn)行臨床指南針對心血管疾病預防保健提出建議時奕剃,雖然有84%的回答是合理的,但是另外4個答案捐腿,不僅錯誤纵朋,而且有害,是嚴肅的臨床診療中絕對不允許出現(xiàn)的茄袖。在更多試驗中操软,還進一步發(fā)現(xiàn)了倫理、法律等方面的問題宪祥。

8月30日聂薪,國務院常務會議審議通過了《網(wǎng)絡數(shù)據(jù)安全管理條例(草案)》,明確提到“要厘清安全邊界蝗羊,保障數(shù)據(jù)依法有序自由流動”藏澳,為促進數(shù)字經(jīng)濟高質(zhì)量發(fā)展、推動科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新營造良好環(huán)境耀找。為了保障數(shù)據(jù)的安全笆载,維護醫(yī)療領(lǐng)域的邊界,我們不僅要在源頭掐滅數(shù)據(jù)泄露的風險涯呻,還要對數(shù)據(jù)傳輸?shù)倪^程中進行內(nèi)容審核凉驻。

二、用技術(shù)檢測風險內(nèi)容

百度作為國內(nèi)最早研究 AI模型安全性問題的公司之一复罐,其內(nèi)容審核平臺以視覺計算涝登、NLP、ASR效诅、OCR等技術(shù)為底座胀滚,能對用戶上傳、發(fā)布或共享的內(nèi)容進行內(nèi)容風險安全審查乱投,提示企業(yè)對不合規(guī)咽笼、疑似的內(nèi)容進行重點關(guān)注。

1戚炫、獨有的大模型能力

大模型能力是實現(xiàn)自動化剑刑、智能化、高效性和準確性的關(guān)鍵技術(shù)之一。內(nèi)容審核基于百度海量數(shù)據(jù)訓練優(yōu)化施掏,利用深度學習技術(shù)及算法迭代模型钮惠,識別準確率高,減少人工復查率七芭,能有效降低企業(yè)運營成本素挽。

測評發(fā)現(xiàn),百度云內(nèi)容審核的大模型能力主要包括以下幾個方面狸驳。通過對文本進行分類和識別预明,判斷其所屬的類別或標簽;對文本進行語義理解和分析耙箍,識別其中的關(guān)鍵詞撰糠、短語、句子的含義和上下文關(guān)系究西;對文本進行情感分析和判斷,識別其中的情感傾向物喷;對圖像進行識別和過濾卤材,判斷其中是否包含違規(guī)或不適宜的內(nèi)容。

2峦失、領(lǐng)先的審核能力

具備高并發(fā)扇丛、高吞吐、低時延等能力尉辑,且算法卓越帆精,識別速度業(yè)界領(lǐng)先,毫秒級響應隧魄,可應對各種實時性業(yè)務需求卓练。

審核維度豐富:緊跟監(jiān)管需求,實時同步政府指令购啄,提供業(yè)內(nèi)最豐富的審核維度襟企,其中圖像審核具備惡心圖、質(zhì)量檢測的獨家識別能力狮含。

審核粒度細膩:具備業(yè)界最豐富顽悼、全面的分類標簽體系,并且持續(xù)更新几迄∥盗可根據(jù)業(yè)務需求,自由組合標簽映胁,讓模型效果猶如“量身定制”木羹。

3、靈活配置

提供靈活的自定義配置功能解孙,內(nèi)設150+項細分審核模型標簽并且持續(xù)更新汇跨,界面化調(diào)整審核維度和松緊度务荆,5分鐘即可完成規(guī)則配置,高效適配多元化穷遂、細粒度業(yè)務場景的審核需求函匕。

更有意思的是,對于業(yè)務中小眾細分場景的模型需求蚪黑,如果通用審核模型還沒覆蓋到盅惜,百度云提供接入Easy-DL零門檻開發(fā)平臺,僅需少量數(shù)據(jù)簡單標注忌穿,最快15分鐘即可訓練對應模型抒寂。

策略配置:可根據(jù)業(yè)務場景,靈活選擇審核維度掠剑、細分標簽屈芜、以及對應的審核松緊度,貼合業(yè)務場景朴译。

數(shù)據(jù)統(tǒng)計:一頁概覽業(yè)務全貌井佑;可查看各個接口按照時間維度的調(diào)用趨勢,并可查看違規(guī)數(shù)據(jù)的類型分布及統(tǒng)計信息眠寿。

數(shù)據(jù)分析:可查看各個媒體類型的數(shù)據(jù)詳情躬翁;支持導出全量多維度Excel表格,便于后續(xù)業(yè)務分析盯拱。

4盒发、部署方式

內(nèi)容審核平臺支持公有云接入、私有化部署狡逢,公有云支持API和HTTP-SDK宁舰。企業(yè)無需自建平臺,可基于自身業(yè)務訴求奢浑,零門檻快速接入使用明吩,靈活選用智能機審平臺或人機協(xié)同審核平臺

三殷费、用 API 接入內(nèi)容審核平臺

出于低代碼印荔、可視化、靈活配置等目的详羡,本節(jié)介紹怎么用API接入內(nèi)容審核平臺仍律。

1、創(chuàng)建應用

應用是調(diào)用 API 服務的基本操作單元实柠。

我們可以基于應用創(chuàng)建成功后獲取的 API Key 及 Secret Key水泉,進行接口調(diào)用操作,及相關(guān)配置。

填寫完畢后草则,即可點擊「立即創(chuàng)建」钢拧,完成應用的創(chuàng)建。點擊左側(cè)導航中的「應用列表」炕横,可以進行應用查看源内。

創(chuàng)建完畢應用后,平臺將會分配此應用的相關(guān)憑證份殿,主要為 AppID膜钓、API Key、Secret Key卿嘲。調(diào)用 API 接口時颂斜,可以使用這些憑證,進行 Access Token(用戶身份驗證和授權(quán)的憑證)的生成拾枣。

2沃疮、調(diào)用服務

調(diào)用 AI 服務相關(guān)的 API 接口有兩種方式,兩種不同的調(diào)用方式采用相同的接口URL梅肤。區(qū)別在于請求方式鑒權(quán)方法不一樣司蔬,請求參數(shù)和返回結(jié)果一致。

調(diào)用方式一? 請求 URL 數(shù)據(jù)格式

向授權(quán)服務地址https://aip.baidubce.com/oauth/2.0/token發(fā)送請求(推薦使用POST)凭语。百度AI開放平臺使用OAuth2.0授權(quán)調(diào)用開放API葱她,調(diào)用API時必須在URL中帶上Access_token參數(shù)撩扒。Access_token是用戶的訪問令牌似扔,承載了用戶的身份、權(quán)限等信息搓谆。

grant_type: 必須參數(shù)炒辉,固定為client_credentials;

client_id: 必須參數(shù)泉手,應用的API Key黔寇;

client_secret: 必須參數(shù),應用的Secret Key斩萌;

獲取 Access_token 有三種方式:通過代碼的形式獲取缝裤,使用網(wǎng)頁調(diào)試工具獲取,在線調(diào)試工具颊郎。具體可參考Access Token獲取

POST 中參數(shù)按照 API 接口說明調(diào)用即可憋飞。

調(diào)用方式二? 請求頭域內(nèi)容

在請求的 HTTP 頭域中包含以下信息,API 認證機制 authorization 必須通過百度云的AK/SK 生成:

host(必填)

x-bce-date (必填)

x-bce-request-id(選填)

authorization(必填)

content-type(必填)

content-length(選填)

四姆吭、結(jié)語

在接下來生命科學領(lǐng)域的尖端探索中榛做,沒有AI輔助工具的醫(yī)生,很可能會遠遠落后于有AI輔助的醫(yī)生。醫(yī)療行業(yè)是一個強監(jiān)管的行業(yè)检眯,任何新技術(shù)進入其中都會受到慎重的評估厘擂。同樣,內(nèi)容安全性锰瘸、合規(guī)性對金融刽严、科技、傳媒等領(lǐng)域也至關(guān)重要获茬。

大模型的白熱化已經(jīng)無法逆轉(zhuǎn)港庄,在數(shù)據(jù)流通的過程中加強內(nèi)容審核,將是大勢所趨恕曲。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末鹏氧,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子佩谣,更是在濱河造成了極大的恐慌把还,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,464評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件茸俭,死亡現(xiàn)場離奇詭異吊履,居然都是意外死亡,警方通過查閱死者的電腦和手機调鬓,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,033評論 3 399
  • 文/潘曉璐 我一進店門艇炎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人腾窝,你說我怎么就攤上這事缀踪。” “怎么了虹脯?”我有些...
    開封第一講書人閱讀 169,078評論 0 362
  • 文/不壞的土叔 我叫張陵驴娃,是天一觀的道長。 經(jīng)常有香客問我循集,道長唇敞,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,979評論 1 299
  • 正文 為了忘掉前任咒彤,我火速辦了婚禮疆柔,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘镶柱。我一直安慰自己旷档,他們只是感情好,可當我...
    茶點故事閱讀 69,001評論 6 398
  • 文/花漫 我一把揭開白布奸例。 她就那樣靜靜地躺著彬犯,像睡著了一般向楼。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谐区,一...
    開封第一講書人閱讀 52,584評論 1 312
  • 那天湖蜕,我揣著相機與錄音,去河邊找鬼宋列。 笑死昭抒,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的炼杖。 我是一名探鬼主播灭返,決...
    沈念sama閱讀 41,085評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼坤邪!你這毒婦竟也來了熙含?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,023評論 0 277
  • 序言:老撾萬榮一對情侶失蹤艇纺,失蹤者是張志新(化名)和其女友劉穎怎静,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體黔衡,經(jīng)...
    沈念sama閱讀 46,555評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡蚓聘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,626評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了盟劫。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片夜牡。...
    茶點故事閱讀 40,769評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖侣签,靈堂內(nèi)的尸體忽然破棺而出塘装,到底是詐尸還是另有隱情,我是刑警寧澤硝岗,帶...
    沈念sama閱讀 36,439評論 5 351
  • 正文 年R本政府宣布氢哮,位于F島的核電站袋毙,受9級特大地震影響型檀,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜听盖,卻給世界環(huán)境...
    茶點故事閱讀 42,115評論 3 335
  • 文/蒙蒙 一胀溺、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧皆看,春花似錦仓坞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,601評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽徙瓶。三九已至,卻和暖如春嫉称,著一層夾襖步出監(jiān)牢的瞬間侦镇,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,702評論 1 274
  • 我被黑心中介騙來泰國打工织阅, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留壳繁,地道東北人。 一個月前我還...
    沈念sama閱讀 49,191評論 3 378
  • 正文 我出身青樓荔棉,卻偏偏與公主長得像闹炉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子润樱,可洞房花燭夜當晚...
    茶點故事閱讀 45,781評論 2 361

推薦閱讀更多精彩內(nèi)容