提高語音輸入信息的準(zhǔn)確率——請再突破 1%!

錘子發(fā)布會后曲楚,老羅在發(fā)布會上提到厘唾,訊飛的語音輸入識別率已經(jīng)達(dá)到了97%,會場的大部分觀眾對此表示一臉懵逼龙誊,場外的我當(dāng)然也是其中一員抚垃。而離我最近的”新玩法“非這個語音輸入無疑了,當(dāng)時馬上就在”搜狗輸入法”上玩了幾個回合。

圖1 “搜狗輸入法”語音輸入按鈕 ? ? 圖2 麥克風(fēng)以水波漣漪擴(kuò)散鹤树,提示正在收音 ? ? 圖3 向上滑動選擇語種

在說話清晰的情況下铣焊,基本能獲得說話的文字內(nèi)容,而且過程中會一直同步輸入文字罕伯,反饋速度快曲伊。久旱逢甘露,以前一直用手機(jī)鍵盤輸入追他,短暫的新鮮感讓我迫不及待向幾個密友介紹這種輸入方式坟募。

圖4 一教會他們用語音輸入,就這樣傷害我 T-T

在移動設(shè)的備聊天場景中邑狸,我常用文字與表情與他人溝通懈糯;特殊場景中,例如不方便鍵盤輸入单雾、需要輸入大量內(nèi)容赚哗,會考慮用語音信息溝通。

但在多內(nèi)容的語音信息傳輸過程中硅堆,也存在著一些的情況屿储。之前曾連續(xù)發(fā)送多個幾十秒時長的語音信息。在錄音過程中硬萍,意識到自己嘴邊的表達(dá)有誤扩所,所以講了30多秒的語音要取消發(fā)送。這個時候要重復(fù)前面30秒的內(nèi)容朴乖,然后重新錄制祖屏。如果不愿重新錄制,則需要再添加修改的語句买羞,如:“剛才上一句說錯了袁勺,不是……,而是……”畜普,原本就攜帶了大量信息期丰,如果還穿插著不同的修改注釋,信息傳達(dá)的準(zhǔn)確率很可能會降低吃挑。

而第二天我也被對方當(dāng)面吐槽了一番钝荡。語音信息內(nèi)容多時間長,一沒記住中間的哪部分就要重聽舶衬;語音內(nèi)容時長差距不明顯的時候埠通,重聽會點選錯;語速快有口音的部分重聽幾次都聽不清逛犹。真是省了說話者的時間端辱,浪費(fèi)了收聽者的時間梁剔。

圖5 生活中的語音轟炸狂人

對語音輸入識別率以及語音信息傳輸缺點有一定了解后,我想在以后需要大量文字輸入的情景里舞蔽,語音輸入會成為我的另一個選擇荣病。

前兩天晚上,需要和朋友分享一些事情渗柿,但由于時間較晚个盆,她表示不方便聽語音,我立馬就決定了使用語音輸入朵栖。在這次大量信息的語音輸入過程中砾省,結(jié)合之前比較淺層次的使用,我歸納了使用過程中出現(xiàn)的一些問題混槐。

1)專有名詞、中英混說造成的語音識別障礙轩性。某些不著名的專有名詞識別率低声登,例如朋友的名字、地方特色詞等揣苏,這些詞語難以識別的同時悯嗓,甚至?xí)绊懞竺孢B接詞語的識別。

2)標(biāo)點符號識別錯誤卸察。語音輸入在句號和逗號的判斷添加上脯厨,基本能滿足我們的需要。它可以根據(jù)說話的停頓節(jié)奏坑质,句子長度自動添加合武。語音輸入過程中帶有“什么”、“怎么”涡扼、“如何”稼跳、“誰”、“哪里”吃沪、“幾”汤善、“嗎”之類的疑問詞,那么這句話很有可能會在句末被加上問號票彪,但是我們有些情況下是不需要的红淡,例如:

?? 我不知道他怎么會在這里。

?? 也不看是誰的東西降铸。

?? 他們想知道東西找著了沒有在旱。

?? 他問你幾歲了。

?? 我不明白他要那些東西干嘛垮耳。

以上幾個句子中颈渊,疑問句在句中充當(dāng)了賓語的成分遂黍,但主句是陳述句,所以句末要加上句號俊嗽。在搜狗輸入法的語音輸入識別中雾家,這幾個句子在句末都被加上了問號。問號存在識別錯誤添加的問題绍豁,而頓號芯咧、冒號、書名號之類的直接是不能識別添加竹揍。

3)停頓造成的斷句錯誤敬飒。說話過程中,時不時會有停頓芬位,例如干咳无拗、思考、被影響昧碉,這些停頓可能會導(dǎo)致句尾出現(xiàn)標(biāo)點英染,造成斷句失當(dāng)。

4)說話陋習(xí)造成的句子邏輯混亂被饿。我自己說話時有一些陋習(xí)四康,像介紹流程、經(jīng)歷之類的事情時狭握,經(jīng)常會不自覺地就連著說很多“然后”闪金,這樣的陋習(xí)在說話的時候很可能是意識不到的,但轉(zhuǎn)為文字后论颅,就需要把它們刪除或改寫哎垦。除了“然后”,還有人會比較喜歡說“就是說”恃疯、“接著”撼泛、“接下來呢”,這種帶有連接事物先后順序的詞語澡谭。除此之外愿题,還有一些像說話語序混亂、無意識重復(fù)某些詞語之類的陋習(xí)蛙奖。

圖6 說話陋習(xí)

5)擔(dān)心語氣詞的情緒被錯誤解讀潘酗。用文字輸入的時候,我通常較少使用語氣詞雁仲,但說話時卻不可避免出現(xiàn)仔夺,例如:“呢”、“嘍”攒砖、“呀”缸兔、“嘛”等日裙。人在說話時,會沉浸在自己語調(diào)惰蜜、情緒的影響里昂拂,伴隨著情緒,語氣詞自然而然地脫口而出抛猖。但當(dāng)面對語音輸入的結(jié)果時格侯,說話時的情緒已經(jīng)消失了,那些帶有“呢”财著、“噢”語氣詞的句子 联四,卻難以重現(xiàn)說話時的情緒。這些不恰當(dāng)語氣詞的存在撑教,可能一不小心就改變了你的語言風(fēng)格朝墩,給你和上司的對話中帶來一些小災(zāi)難。

圖7 不合適的語氣詞

我們對語音輸入結(jié)果不是十分滿意的原因伟姐,除了技術(shù)層面的問題鱼辙,便是說話內(nèi)容不能在從口語到書面語的情景轉(zhuǎn)換中做到自適應(yīng)。

在社交聊天場景中玫镐,把交流的內(nèi)容稱作書面語可能有失妥當(dāng)。但在以往鍵盤輸入的過程中怠噪,我們大腦使用了書面語形成的方法恐似,所以內(nèi)容會更偏向于書面語的模式。而正是這部分書面語化的內(nèi)容傍念,跟語音輸入的口語化內(nèi)容存在的差別矫夷,造成了我們對語音輸入結(jié)果的不適應(yīng)。

組成的書面語和口語的材料來自同一個庫憋槐,但由于兩者對材料的篩選双藕、采納使用了不同的規(guī)則,所以組成口語和書面語的材料也是不盡相同的阳仔。詞匯上忧陪,口語詞匯簡單明了、通俗冗雜近范,書面語詞匯則富有表現(xiàn)力嘶摊,規(guī)范正式;句法上评矩,口語多使用簡單句叶堆、短句,結(jié)構(gòu)簡單直接斥杜;書面語則長句虱颗,復(fù)合句更多沥匈,語句結(jié)構(gòu)復(fù)雜。

口語形成時間短忘渔,且單向不可逆高帖,一旦通過聲音發(fā)出便是輸出的結(jié)果,即使后來進(jìn)行修改更正也不能在時空上對之前說過的話造成改變辨萍。而書面語形成是一個可反復(fù)回歸的過程棋恼,在文字輸出過程中,可以不斷檢閱修正锈玉,直至最后輸出書寫結(jié)果爪飘。

圖8 口語的形成過程
圖9 書面語的形成過程

在口語和書面語系統(tǒng)中,如果在對方的環(huán)境里拉背,使用自己的語言規(guī)則师崎,便會帶來一種強(qiáng)烈的不適感。如果是在口語環(huán)境中使用書面語椅棺,就好像穿著正式的禮服出現(xiàn)在了運(yùn)動場犁罩。在每個人都在肆意奔跑的場景里,你卻挺著腰桿两疚,邁著謹(jǐn)慎的步伐床估,維持著禮貌的微笑,擔(dān)心襯不起今天穿著的那套禮服诱渤。反之丐巫,則是在宴會中穿著運(yùn)動服奔跑,隨意揮灑的汗水勺美、唐突的沖撞递胧、運(yùn)動鞋與地板的摩擦聲與會場的悠揚(yáng)樂聲自然是格格不入。

這兩種做法并不是說不可行赡茸,只是那種情景下帶來的不適感讓大部分人都望而卻步了缎脾。所以我們在語音輸入過程中,始終會對某些口語輸入的句子感到不適占卧,因為輸入后的結(jié)果變成了書面語遗菠,我們會不自覺地用書面語系統(tǒng)去檢閱這些結(jié)果。

與此同時华蜒,除了語言內(nèi)容外舷蒲,語言外因素也對內(nèi)容傳達(dá)造成了影響。語言外因素(無法通過語言傳遞的信息友多,例如:語音牲平、語調(diào)、視線域滥、表情纵柿、手勢等)對信息傳達(dá)也起到了重要的作用蜈抓。在書面語中,只有語言內(nèi)容是有用的昂儒;而在口語表達(dá)中沟使,語言內(nèi)容和部分語言外因素共同起到了作用。在語音輸入情景中渊跋,我們在說話過程會自動帶入自己的情緒腊嗡,這個過程有一部分語言外因素協(xié)助我們傳達(dá)自己的情緒,例如拾酝,利用停頓強(qiáng)調(diào)重要性燕少、高聲調(diào)表示憤怒、語速快表示著急蒿囤。但通過語音輸入被轉(zhuǎn)換成文字后客们,語言外因素攜帶的情緒便被消磨得差不多了,最終還是需要對這些經(jīng)過機(jī)器輸出的內(nèi)容進(jìn)行潤色修改材诽。

既然語音輸入存在現(xiàn)在的一些問題底挫,特別是在需要相對大量文字輸入的情境中,我們就更需要找到一些方法去更高效地修正語音輸入的結(jié)果脸侥,而不是在那個小小的輸入框建邓,用大拇指經(jīng)過數(shù)不清次的點觸、拖移睁枕、滑動官边,最后獲得的結(jié)果還是不如所愿。

圖10 微信文字輸入修正的例子

在錘子發(fā)布會提及科大訊飛語音輸入的同時譬重,Big Bang 和 One Step 也亮眼無比。經(jīng)過大拇指一貼罐氨,Big Bang 就會把按住的文字“炸”開臀规,用戶就可以對文字進(jìn)行搜索、分享和復(fù)制的動作栅隐。Big Bang 帶來交互上的新體驗塔嬉,解決了人們在信息編輯上的痛點。錘子公司想通過這樣的方式租悄,讓手持設(shè)備在信息處理和識別方面上擁有比電腦還高的效率谨究。這樣的 Big Bang 自然可以對語音輸入的文字結(jié)果進(jìn)行一定程度修正。

在眾多應(yīng)用推薦平臺上中泣棋,留意到了一款叫做的 Clipboard Plus 的應(yīng)用胶哲。它的界面融合了Big Bang 和 One Step 的框架。通過復(fù)制動作潭辈,再點擊懸浮球即可進(jìn)入分詞操作界面鸯屿。

圖11 Clipboard Plus 操作演示

通過對大段文字進(jìn)行分詞處理澈吨,再篩選需要的內(nèi)容,最后再發(fā)送修改后的結(jié)果寄摆。Clipboard Plus 創(chuàng)造了一個獨(dú)立編輯修改文字的環(huán)境谅辣,充分利用屏幕空間,分詞邏輯婶恼,讓用戶在修改大段文字上減少了原本在狹小編輯區(qū)域內(nèi)的壓迫感桑阶,頓時感覺豁然開朗。同時勾邦,它的一些簡易操作蚣录,例如點擊“全選”可以進(jìn)行反選,在刪除少量錯誤詞語上可以說相當(dāng)方便检痰。修改后的語段可以通過點選分享欄中的應(yīng)用包归,直接進(jìn)行輸入、搜索铅歼、分享等動作公壤。

如果你想體驗一下這種不同于以往的文字編輯方式,可以在應(yīng)用商店通過搜索“Clipboard Plus”椎椰,免費(fèi)下載厦幅。

不得不說這類型的軟件為語音輸入結(jié)果的修正提供了不少方便,但針對實際使用場景慨飘,可能還需要增加信息置換确憨、插入、快捷選擇等的功能瓤的。但當(dāng)真有了這些功能時休弃,可能會變成一個臃腫的擁有分詞功能的文字處理應(yīng)用軟件。在未來圈膏,相信開發(fā)者塔猾、設(shè)計師們還會為此創(chuàng)造出更多優(yōu)秀的產(chǎn)品,去處理好信息的編輯處理與識別利用的問題稽坤。與此同時丈甸,手持設(shè)備的語音輸入也能因此而獲得更好的發(fā)展空間。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末尿褪,一起剝皮案震驚了整個濱河市睦擂,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌杖玲,老刑警劉巖顿仇,帶你破解...
    沈念sama閱讀 217,277評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡夺欲,警方通過查閱死者的電腦和手機(jī)跪帝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來些阅,“玉大人伞剑,你說我怎么就攤上這事∈新瘢” “怎么了黎泣?”我有些...
    開封第一講書人閱讀 163,624評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長缤谎。 經(jīng)常有香客問我抒倚,道長,這世上最難降的妖魔是什么坷澡? 我笑而不...
    開封第一講書人閱讀 58,356評論 1 293
  • 正文 為了忘掉前任托呕,我火速辦了婚禮,結(jié)果婚禮上频敛,老公的妹妹穿的比我還像新娘项郊。我一直安慰自己,他們只是感情好斟赚,可當(dāng)我...
    茶點故事閱讀 67,402評論 6 392
  • 文/花漫 我一把揭開白布着降。 她就那樣靜靜地躺著,像睡著了一般拗军。 火紅的嫁衣襯著肌膚如雪任洞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,292評論 1 301
  • 那天发侵,我揣著相機(jī)與錄音交掏,去河邊找鬼。 笑死刃鳄,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的铲汪。 我是一名探鬼主播熊尉,決...
    沈念sama閱讀 40,135評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼罐柳,長吁一口氣:“原來是場噩夢啊……” “哼掌腰!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起张吉,我...
    開封第一講書人閱讀 38,992評論 0 275
  • 序言:老撾萬榮一對情侶失蹤齿梁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體勺择,經(jīng)...
    沈念sama閱讀 45,429評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡创南,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,636評論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了省核。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片稿辙。...
    茶點故事閱讀 39,785評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖气忠,靈堂內(nèi)的尸體忽然破棺而出邻储,到底是詐尸還是另有隱情,我是刑警寧澤旧噪,帶...
    沈念sama閱讀 35,492評論 5 345
  • 正文 年R本政府宣布吨娜,位于F島的核電站,受9級特大地震影響淘钟,放射性物質(zhì)發(fā)生泄漏宦赠。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,092評論 3 328
  • 文/蒙蒙 一米母、第九天 我趴在偏房一處隱蔽的房頂上張望勾扭。 院中可真熱鬧,春花似錦爱咬、人聲如沸尺借。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽燎斩。三九已至,卻和暖如春蜂绎,著一層夾襖步出監(jiān)牢的瞬間栅表,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評論 1 269
  • 我被黑心中介騙來泰國打工师枣, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留怪瓶,地道東北人。 一個月前我還...
    沈念sama閱讀 47,891評論 2 370
  • 正文 我出身青樓践美,卻偏偏與公主長得像洗贰,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子陨倡,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,713評論 2 354

推薦閱讀更多精彩內(nèi)容