數(shù)學(xué)公式的識別

LaTeX

在上世紀(jì)80年代初期,由美國計算機(jī)學(xué)家萊斯利·蘭伯特開發(fā)的LaTeX邑闲,可以生成復(fù)雜表格和數(shù)學(xué)公式戳寸,得到高印刷質(zhì)量的科技和數(shù)學(xué)類文檔書籍等。目前在學(xué)術(shù)圈和各大出版商都廣泛的使用這種系統(tǒng)來排版努释、編輯科學(xué)文檔碘梢,尤其是數(shù)學(xué)論文、書籍等伐蒂。數(shù)學(xué)公式的編輯排版得到了良好的解決煞躬,提高了印刷質(zhì)量。目前LaTeX的主流編輯器有Texworks逸邦、TextStudio恩沛、WinEdt等,當(dāng)然也可以使用Visual Studio Code缕减、Sublime Text雷客、Atom等文本編輯器配合各自的插件搭建LaTeX編輯環(huán)境。如果有志于學(xué)術(shù)研究烛卧、經(jīng)常編寫論文佛纫、學(xué)術(shù)海報、雜志和書籍的話总放,建議可以了解一下呈宇。快速入門LaTeX也不是一件困難的事情局雄,網(wǎng)上也有大量的資料可查甥啄。

但隨著互聯(lián)網(wǎng)的發(fā)展,在頁面中展示數(shù)學(xué)公式還存在若干的問題炬搭;為解決在瀏覽器中渲染數(shù)學(xué)公式蜈漓,先后出現(xiàn)了MathJax和Katex穆桂。它們的數(shù)學(xué)公式代碼標(biāo)記大致相同,均可實現(xiàn)在瀏覽器顯示出LaTeX格式的公式融虽∠硗辏可能大家都知道,現(xiàn)在很多的自媒體和博客等后臺都有圖文編輯功能有额,很多支持markdown(比如技術(shù)博客CSDN般又,知乎還支持公式編輯);但是也有很多平臺不支持公式的編輯和渲染巍佑,比如公眾號就不支持茴迁。因此,這些平臺上的數(shù)學(xué)內(nèi)容都是圖片萤衰,用起來...誰用誰知道...堕义。目前我的公眾號中,數(shù)學(xué)類的圖文都是通過Visual Studio Code或Sublime Text配合相關(guān)插件來編寫markdown脆栋,然后將其中的公式轉(zhuǎn)化為圖片倦卖,再粘貼到公眾號圖文編輯器。目前的內(nèi)容平臺筹吐,貌似沒怎么考慮到這種需求糖耸。

雖然TeX格式的數(shù)學(xué)公式編寫和渲染都已解決,但離廣泛使用還很遠(yuǎn)丘薛,原因很多。個人覺得邦危,有一個很大的原因就是公式編寫對大多數(shù)人來說洋侨,還是陌生+繁瑣,我們的習(xí)慣是手寫倦蚪。這也是數(shù)學(xué)在線教育希坚、網(wǎng)絡(luò)數(shù)學(xué)內(nèi)容傳播的一個痛點,而且圖片格式的數(shù)學(xué)公式是不利于百度陵且、Google等搜索引擎的檢索的裁僧。那有沒有什么好的辦法呢?有慕购,公式識別聊疲!請看下文。

公式識別

數(shù)學(xué)公式的識別重要性不言而喻沪悲,同時公式的識別(印刷體的識別获洲、手寫體的識別)要比文字的識別要困難的多。目前谷歌殿如、百度贡珊、阿里巴巴等互聯(lián)網(wǎng)巨頭的AI項目都是通用AI項目最爬,均沒有公式識別。幸好门岔,還是有些人在努力的爱致,而且還不錯。比如寒随,接下來主要介紹的Mathpix糠悯。

使用Python調(diào)用Mathpix的API,只是每月只能免費調(diào)用1000次牢裳,超過一千是收費的逢防;當(dāng)然還需要登錄,完成注冊蒲讯,獲取“app_key”忘朝,國內(nèi)用戶請Email聯(lián)系:support@mathpix.com。下面是調(diào)用代碼判帮,更多細(xì)節(jié)可參其考官網(wǎng)局嘁。

import urllib.request as Request
import urllib.parse as parse
import sys
import base64
import json

class math_formula_recognize:
    def __init__(self):
        self.mathpix_url = 'https://api.mathpix.com/v3/latex'
        self.headers = {'User-Agent': "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.96 Safari/537.36",
        'app_id':'XXXXX',
        'app_key':'YYYYYYYYYY',
        'Content-type': 'application/json'}

    def get_Latex(self,image_path = 'test1.jpg'):
        try:
            image_uri = "data:image/jpg;base64," + str(base64.b64encode(open(image_path, "rb").read()))
            data = {'url': image_uri}
            data = parse.urlencode(data).encode('utf-8')
            req = Request.Request(url = self.mathpix_url,headers = self.headers,data = data)
            res = Request.urlopen(req).read()
            print(res)

        except Exception as e:
            raise e


if __name__ == '__main__':
    test = math_formula_recognize()
    test.get_Latex()

除了通過API使用,還可在官網(wǎng)下載相關(guān)的轉(zhuǎn)化工具晦墙。

用戶體驗

什么時候公式識別能夠做到實時準(zhǔn)確的識別手寫體悦昵,同時完成渲染,那么會大大的助力網(wǎng)絡(luò)上數(shù)學(xué)內(nèi)容的豐富和交流晌畅。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末但指,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子抗楔,更是在濱河造成了極大的恐慌棋凳,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,946評論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件连躏,死亡現(xiàn)場離奇詭異剩岳,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)入热,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,336評論 3 399
  • 文/潘曉璐 我一進(jìn)店門拍棕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人勺良,你說我怎么就攤上這事绰播。” “怎么了郑气?”我有些...
    開封第一講書人閱讀 169,716評論 0 364
  • 文/不壞的土叔 我叫張陵幅垮,是天一觀的道長。 經(jīng)常有香客問我,道長忙芒,這世上最難降的妖魔是什么示弓? 我笑而不...
    開封第一講書人閱讀 60,222評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮呵萨,結(jié)果婚禮上奏属,老公的妹妹穿的比我還像新娘。我一直安慰自己潮峦,他們只是感情好囱皿,可當(dāng)我...
    茶點故事閱讀 69,223評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著忱嘹,像睡著了一般嘱腥。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上拘悦,一...
    開封第一講書人閱讀 52,807評論 1 314
  • 那天齿兔,我揣著相機(jī)與錄音,去河邊找鬼础米。 笑死分苇,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的屁桑。 我是一名探鬼主播医寿,決...
    沈念sama閱讀 41,235評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蘑斧!你這毒婦竟也來了靖秩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,189評論 0 277
  • 序言:老撾萬榮一對情侶失蹤竖瘾,失蹤者是張志新(化名)和其女友劉穎盆偿,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體准浴,經(jīng)...
    沈念sama閱讀 46,712評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,775評論 3 343
  • 正文 我和宋清朗相戀三年捎稚,在試婚紗的時候發(fā)現(xiàn)自己被綠了乐横。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,926評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡今野,死狀恐怖葡公,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情条霜,我是刑警寧澤催什,帶...
    沈念sama閱讀 36,580評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站宰睡,受9級特大地震影響蒲凶,放射性物質(zhì)發(fā)生泄漏气筋。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,259評論 3 336
  • 文/蒙蒙 一旋圆、第九天 我趴在偏房一處隱蔽的房頂上張望宠默。 院中可真熱鬧,春花似錦灵巧、人聲如沸搀矫。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,750評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽瓤球。三九已至,卻和暖如春敏弃,著一層夾襖步出監(jiān)牢的瞬間卦羡,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,867評論 1 274
  • 我被黑心中介騙來泰國打工权她, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留虹茶,地道東北人。 一個月前我還...
    沈念sama閱讀 49,368評論 3 379
  • 正文 我出身青樓隅要,卻偏偏與公主長得像蝴罪,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子步清,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,930評論 2 361

推薦閱讀更多精彩內(nèi)容