如何撰寫涉及機器學(xué)習(xí)的權(quán)利要求

同行推薦一篇文章,覺得不錯搜吧,稍微花了點時間翻譯成中文供交流怜奖。

時間精力有限浑测,若有錯誤,歡迎指正歪玲。

原文地址:patentdocs

原標(biāo)題:How to Draft Patent Claims for Machine Learning Inventions

原作者:Michael Borella


引言

現(xiàn)在似乎大家都在討論人工智能迁央,特別是其中的機器學(xué)習(xí)。雖然有些討論是由人力被機器人或算法取代的恐慌而引發(fā)的滥崩,但是人們也提出了更可靠也更合理的分析岖圈,即:機器學(xué)習(xí)是一個平臺,這個平臺會帶來科學(xué)钙皮、技術(shù)蜂科、醫(yī)藥和生活方式上的巨大變化。

不夸張地說短条,從產(chǎn)業(yè)到商業(yè)部門导匣,機器學(xué)習(xí)代表了問題解決方式上的根本性變化。在不久的將來茸时,就像之前的網(wǎng)絡(luò)和數(shù)據(jù)庫一樣贡定,機器學(xué)習(xí)庫可能會成為所有計算機的標(biāo)準(zhǔn)配置。

對于大多數(shù)現(xiàn)存的計算機而言可都,開發(fā)者寫出函數(shù)缓待,這些函數(shù)根據(jù)一些輸入來產(chǎn)生所需要的輸出。機器學(xué)習(xí)逆轉(zhuǎn)了這個定式渠牲,先獲取一個數(shù)據(jù)集(在實踐中通常需要很大)旋炒,這個數(shù)據(jù)集包含了輸入和每個輸入所對應(yīng)的輸出之間的映射關(guān)系。將這個數(shù)據(jù)集輸入一機器學(xué)習(xí)算法(例如签杈,神經(jīng)網(wǎng)絡(luò)瘫镇、決策樹、支持向量機等)中答姥,這個機器學(xué)習(xí)算法訓(xùn)練一個模型來“學(xué)習(xí)”一個能以足夠高的精確度生成這些映射關(guān)系的函數(shù)铣除。換句話說,如果我們給計算機足夠大的輸入和輸出集踢涌,這個機器學(xué)習(xí)算法將為我們求出這個函數(shù)通孽。并且,這個函數(shù)甚至能夠為訓(xùn)練時沒有出現(xiàn)過的輸入生成正確的輸出睁壁。開發(fā)者(現(xiàn)在有個時髦的稱謂——“數(shù)據(jù)科學(xué)家”)們準(zhǔn)備映射關(guān)系背苦、選取和調(diào)整機器學(xué)習(xí)算法并估算目標(biāo)模型的性能。一旦模型在測試數(shù)據(jù)上足夠精確潘明,就可以發(fā)布該模型以供實際使用行剂。

人們目前已經(jīng)在使用這些模型——這些模型提出我們可能會想要購買的產(chǎn)品、可能感興趣的電影和音樂方面的建議钳降。它們還默默地提升了我們的數(shù)字相機所拍攝照片的質(zhì)量厚宰、協(xié)助機場和體育場的安檢工作、檢測經(jīng)濟詐騙和優(yōu)化我們的在線檢索結(jié)果。然而铲觉,機器學(xué)習(xí)在真實世界中的適用性尚未達(dá)到最佳澈蝙。

很自然地,跟任何其他工業(yè)領(lǐng)域的創(chuàng)新者一樣撵幽,機器學(xué)習(xí)領(lǐng)域的創(chuàng)新者們希望用專利來保護他們的工作成果灯荧。事實上,特別是在美國盐杂,與人工智能和機器學(xué)習(xí)相關(guān)的專利申請數(shù)量近幾年正在急速增長逗载。然而,發(fā)明人链烈、申請人甚至專利律師在涉及機器學(xué)習(xí)的權(quán)利要求的撰寫策略上卻經(jīng)常遇到困難厉斟。

撰寫此類權(quán)利要求時應(yīng)采取的策略,當(dāng)然應(yīng)取決于發(fā)明的特點强衡,以及機器學(xué)習(xí)與之結(jié)合的方式擦秽。因此,并不存在什么特別的類似“殺手锏”的解決方式食侮。然而号涯,通過若干指導(dǎo)原則,我們在撰寫權(quán)利要求時就能盡量為客戶爭取最大的利益锯七。

簡言之链快,這些指導(dǎo)原則包括關(guān)注機器學(xué)習(xí)類發(fā)明中創(chuàng)新最有可能出現(xiàn)的幾個方面:(i) 模型的結(jié)構(gòu);(ii) 訓(xùn)練過程眉尸;(iii) 輸入數(shù)據(jù)的準(zhǔn)備過程域蜗;(iv) 輸入數(shù)據(jù)和模型之間的映射關(guān)系;以及(v) 模型輸出數(shù)據(jù)的后期處理及解釋噪猾。除了這五條“積極”的規(guī)則以外霉祸,還有不建議去做的兩條“消極”的規(guī)則:(i) 不要將訓(xùn)練階段和執(zhí)行階段混在同一個權(quán)利要求中;以及(ii) 謹(jǐn)慎處理僅僅是常規(guī)地將已有的模型套用在已有的數(shù)據(jù)上的發(fā)明袱蜡。

下面會依次說明這些原則丝蹭。但是在整個討論中,須謹(jǐn)記細(xì)節(jié)的重要性坪蚁。就像大多數(shù)的發(fā)明一樣奔穿,機器學(xué)習(xí)過程的權(quán)利要求必須為讀者(例如專利審查員或法官)提供足夠多的細(xì)節(jié),從而說服讀者這件發(fā)明確應(yīng)被授權(quán)敏晤。上位的或者模糊的權(quán)利要求難以滿足新穎性和非顯而易見性(注:創(chuàng)造性)的要求贱田,因而主題的適格性會弱得多。


要求保護模型的結(jié)構(gòu)

如果發(fā)明包含一個新的或者不常見的模型結(jié)構(gòu)嘴脾,這個方面就很適于撰寫權(quán)利要求男摧。比如說,獲得所需結(jié)果的關(guān)鍵是一個具有特殊的層結(jié)構(gòu)或者每層的神經(jīng)元個數(shù),還是并聯(lián)或串聯(lián)的多重神經(jīng)網(wǎng)絡(luò)耗拓?更進(jìn)一步地拇颅,某些問題的已知解決方案集成了兩個或更多的模型。如果我們的問題可以用一個集成模塊來完整描述帆离,并且這個集成模塊的結(jié)構(gòu)是新的蔬蕊,那么就可以從這一點出發(fā)來撰寫權(quán)利要求结澄。


要求保護訓(xùn)練過程

特別是在使用非常規(guī)的模型的時候哥谷,這個模型的訓(xùn)練過程可能也是非常規(guī)的。這就提供了撰寫權(quán)利要求的另一途徑麻献。比方說们妥,是用輸入數(shù)據(jù)的特定子集訓(xùn)練模型的每個部分,還是分階段訓(xùn)練這個模型勉吻?訓(xùn)練的過程是否采用了精心設(shè)計的并行進(jìn)程從而減少了訓(xùn)練時間监婶?不論如何,如果模型訓(xùn)練的執(zhí)行過程(例如輸入數(shù)據(jù)的應(yīng)用)是以規(guī)范的方式實現(xiàn)的齿桃,那么訓(xùn)練的過程更容易得到保護惑惶,故應(yīng)仔細(xì)推敲。另一方面短纵,一旦模型訓(xùn)練結(jié)束而投入商用带污,檢測訓(xùn)練階段的侵權(quán)將會很困難。


要求保護訓(xùn)練數(shù)據(jù)的準(zhǔn)備過程

數(shù)據(jù)科學(xué)家花費大量的時間準(zhǔn)備訓(xùn)練數(shù)據(jù)香到,用來生成一個模型鱼冀。真實世界的數(shù)據(jù)雜亂無章而通常需要進(jìn)行歸一化、轉(zhuǎn)換悠就、移除離群值或者進(jìn)行其他處理千绪,從而有助于通過數(shù)據(jù)特征得到有用的結(jié)果。通常而言梗脾,這是個試錯過程荸型,數(shù)據(jù)科學(xué)家嘗試多種不同的方式才能找到合適的處理方式。例如炸茧,有些自然語言處理模型可能采用字?jǐn)?shù)統(tǒng)計瑞妇,但是可能從計數(shù)中移除諸如“與”“該”“其”(注:“and”, “the”, “it”)等常用詞,以使模型聚焦在跟描述的問題更接近且具有上下文含義的詞語上宇立。


要求保護輸入和模型的映射關(guān)系

一旦我們選擇好模型并準(zhǔn)備好數(shù)據(jù)踪宠,我們就要把輸入數(shù)據(jù)映射到模型的輸入。因為選用的模型和輸入數(shù)據(jù)的準(zhǔn)備方式要匹配妈嘹,所以這常常是一個固有的操作柳琢。盡管如此,這種映射關(guān)系仍然很有意思。比如柬脸,一個用來區(qū)分黑白照片的各部分的神經(jīng)網(wǎng)絡(luò)可能有64個輸入他去,其中每個輸入對應(yīng)于一幅圖像中的一個8×8的區(qū)域中的一個像素。每個輸入可以是代表相應(yīng)的像素的強度(亮度)的數(shù)值倒堕。如果這種映射能達(dá)到創(chuàng)新的程度灾测,那么這就可以用來寫權(quán)利要求。


要求保護模型輸出數(shù)據(jù)的后期處理及解釋

即便因為一個模型會提供一個結(jié)果垦巴,甚至是理想的結(jié)果媳搪,整個機器學(xué)習(xí)的過程也未必就已經(jīng)結(jié)束了。某些情況下骤宣,模型的原始的輸出需要轉(zhuǎn)換秦爆、歸一化或者輸入另一個算法中,以獲得有用的輸出數(shù)據(jù)憔披。在另一些情況下等限,如上所述,一個模型的輸出可能(在或未在中間處理后)被用作另一模型的輸入芬膝。對于某些模型來說望门,模型自身的某些部分就是輸出——可能一個神經(jīng)網(wǎng)絡(luò)的某個特殊層是輸入的語義的編碼。


不要將訓(xùn)練階段和執(zhí)行階段混在同一個權(quán)利要求中

一個機器學(xué)習(xí)模型首先需要經(jīng)過訓(xùn)練锰霜,才能投入生產(chǎn)應(yīng)用筹误。因此,很有可能訓(xùn)練一個模型的實體和使用該模型的實體是不同的锈遥。相應(yīng)地纫事,同時將涉及訓(xùn)練和使用模型的步驟或特征記載于一條權(quán)利要求中,將導(dǎo)致這些實體對權(quán)利要求進(jìn)行共同侵權(quán)所灸。相反丽惶,應(yīng)為訓(xùn)練階段和使用階段分開撰寫?yīng)毩?quán)利要求。在使用階段部分可能因沒有足夠的實質(zhì)內(nèi)容而無法獨立存在的情況下爬立,訓(xùn)練階段的細(xì)節(jié)可通過被動分句(注:passive clauses)的形式進(jìn)行限定(例如钾唬,“其中該模型通過將隨機像素輸入和圖像分類標(biāo)注數(shù)據(jù)進(jìn)行比較的方式訓(xùn)練……”)。


不要撰寫僅將已有模型常規(guī)套用于已有數(shù)據(jù)的權(quán)利要求

如同任何技術(shù)領(lǐng)域一樣侠驯,有些技術(shù)方案比其他技術(shù)方案的可專利性要弱抡秆。如果正在處理的發(fā)明申請將現(xiàn)成的模型以常規(guī)的方式應(yīng)用于已有的數(shù)據(jù)集,并且與以上所述的任一“積極”的規(guī)則都沒有關(guān)聯(lián)吟策,那么我們可能不應(yīng)將精力放在機器學(xué)習(xí)方面儒士。就算機器學(xué)習(xí)有新穎性,那么至少將任一一般模型應(yīng)用于一個數(shù)據(jù)集的總體概念也是顯而易見的檩坚。因此着撩,應(yīng)關(guān)注發(fā)明的其他可以保護的創(chuàng)新诅福。


結(jié)語

盡管機器學(xué)習(xí)在接下來幾年中仍將幾乎無疑是一個活躍的領(lǐng)域,尋求機器學(xué)習(xí)發(fā)明的有效保護的道路上依然坑坑洼洼拖叙。盡管上面的指導(dǎo)原則并不詳盡氓润,遵循這些指導(dǎo)原則也將避開大多數(shù)顯見的陷阱。

最后薯鳍,提醒各位嘗試跨入機器學(xué)習(xí)領(lǐng)域的專利代理人和專利律師:做好功課咖气。不要將機器學(xué)習(xí)作為一個可以事后補入權(quán)利要求中的黑盒子技術(shù)(注:筆者理解此處的修改是針對審查過程的)。相反挖滤,(應(yīng)該)自主學(xué)習(xí)為什么機器學(xué)習(xí)可以工作崩溪,以及機器學(xué)習(xí)是如何運作的。采取任何可用的手段壶辜,例如閱讀報刊和書籍悯舟、看視頻、參加課程砸民、做一些編程。這樣做可以大大增強我們撰寫涉及這些技術(shù)的有效權(quán)利要求(以及專利申請的其他部分)的能力奋救。


譯文轉(zhuǎn)載請聯(lián)系作者并注明出處岭参。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市尝艘,隨后出現(xiàn)的幾起案子演侯,更是在濱河造成了極大的恐慌,老刑警劉巖背亥,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秒际,死亡現(xiàn)場離奇詭異,居然都是意外死亡狡汉,警方通過查閱死者的電腦和手機娄徊,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盾戴,“玉大人寄锐,你說我怎么就攤上這事〖夥龋” “怎么了橄仆?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長衅斩。 經(jīng)常有香客問我盆顾,道長,這世上最難降的妖魔是什么畏梆? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任您宪,我火速辦了婚禮惫搏,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蚕涤。我一直安慰自己筐赔,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布揖铜。 她就那樣靜靜地躺著茴丰,像睡著了一般。 火紅的嫁衣襯著肌膚如雪天吓。 梳的紋絲不亂的頭發(fā)上贿肩,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天,我揣著相機與錄音龄寞,去河邊找鬼汰规。 笑死,一個胖子當(dāng)著我的面吹牛物邑,可吹牛的內(nèi)容都是我干的溜哮。 我是一名探鬼主播,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼色解,長吁一口氣:“原來是場噩夢啊……” “哼茂嗓!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起科阎,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤述吸,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后锣笨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蝌矛,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年错英,在試婚紗的時候發(fā)現(xiàn)自己被綠了入撒。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡走趋,死狀恐怖衅金,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情簿煌,我是刑警寧澤氮唯,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站姨伟,受9級特大地震影響惩琉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜夺荒,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一瞒渠、第九天 我趴在偏房一處隱蔽的房頂上張望良蒸。 院中可真熱鬧,春花似錦伍玖、人聲如沸嫩痰。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽串纺。三九已至,卻和暖如春椰棘,著一層夾襖步出監(jiān)牢的瞬間纺棺,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工邪狞, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留祷蝌,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓帆卓,卻偏偏與公主長得像巨朦,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鳞疲,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,492評論 2 348