錘子發(fā)布會后曲楚,老羅在發(fā)布會上提到厘唾,訊飛的語音輸入識別率已經(jīng)達(dá)到了97%,會場的大部分觀眾對此表示一臉懵逼龙誊,場外的我當(dāng)然也是其中一員抚垃。而離我最近的”新玩法“非這個語音輸入無疑了,當(dāng)時馬上就在”搜狗輸入法”上玩了幾個回合。
在說話清晰的情況下铣焊,基本能獲得說話的文字內(nèi)容,而且過程中會一直同步輸入文字罕伯,反饋速度快曲伊。久旱逢甘露,以前一直用手機(jī)鍵盤輸入追他,短暫的新鮮感讓我迫不及待向幾個密友介紹這種輸入方式坟募。
在移動設(shè)的備聊天場景中邑狸,我常用文字與表情與他人溝通懈糯;特殊場景中,例如不方便鍵盤輸入单雾、需要輸入大量內(nèi)容赚哗,會考慮用語音信息溝通。
但在多內(nèi)容的語音信息傳輸過程中硅堆,也存在著一些的情況屿储。之前曾連續(xù)發(fā)送多個幾十秒時長的語音信息。在錄音過程中硬萍,意識到自己嘴邊的表達(dá)有誤扩所,所以講了30多秒的語音要取消發(fā)送。這個時候要重復(fù)前面30秒的內(nèi)容朴乖,然后重新錄制祖屏。如果不愿重新錄制,則需要再添加修改的語句买羞,如:“剛才上一句說錯了袁勺,不是……,而是……”畜普,原本就攜帶了大量信息期丰,如果還穿插著不同的修改注釋,信息傳達(dá)的準(zhǔn)確率很可能會降低吃挑。
而第二天我也被對方當(dāng)面吐槽了一番钝荡。語音信息內(nèi)容多時間長,一沒記住中間的哪部分就要重聽舶衬;語音內(nèi)容時長差距不明顯的時候埠通,重聽會點選錯;語速快有口音的部分重聽幾次都聽不清逛犹。真是省了說話者的時間端辱,浪費(fèi)了收聽者的時間梁剔。
對語音輸入識別率以及語音信息傳輸缺點有一定了解后,我想在以后需要大量文字輸入的情景里舞蔽,語音輸入會成為我的另一個選擇荣病。
前兩天晚上,需要和朋友分享一些事情渗柿,但由于時間較晚个盆,她表示不方便聽語音,我立馬就決定了使用語音輸入朵栖。在這次大量信息的語音輸入過程中砾省,結(jié)合之前比較淺層次的使用,我歸納了使用過程中出現(xiàn)的一些問題混槐。
1)專有名詞、中英混說造成的語音識別障礙轩性。某些不著名的專有名詞識別率低声登,例如朋友的名字、地方特色詞等揣苏,這些詞語難以識別的同時悯嗓,甚至?xí)绊懞竺孢B接詞語的識別。
2)標(biāo)點符號識別錯誤卸察。語音輸入在句號和逗號的判斷添加上脯厨,基本能滿足我們的需要。它可以根據(jù)說話的停頓節(jié)奏坑质,句子長度自動添加合武。語音輸入過程中帶有“什么”、“怎么”涡扼、“如何”稼跳、“誰”、“哪里”吃沪、“幾”汤善、“嗎”之類的疑問詞,那么這句話很有可能會在句末被加上問號票彪,但是我們有些情況下是不需要的红淡,例如:
?? 我不知道他怎么會在這里。
?? 也不看是誰的東西降铸。
?? 他們想知道東西找著了沒有在旱。
?? 他問你幾歲了。
?? 我不明白他要那些東西干嘛垮耳。
以上幾個句子中颈渊,疑問句在句中充當(dāng)了賓語的成分遂黍,但主句是陳述句,所以句末要加上句號俊嗽。在搜狗輸入法的語音輸入識別中雾家,這幾個句子在句末都被加上了問號。問號存在識別錯誤添加的問題绍豁,而頓號芯咧、冒號、書名號之類的直接是不能識別添加竹揍。
3)停頓造成的斷句錯誤敬飒。說話過程中,時不時會有停頓芬位,例如干咳无拗、思考、被影響昧碉,這些停頓可能會導(dǎo)致句尾出現(xiàn)標(biāo)點英染,造成斷句失當(dāng)。
4)說話陋習(xí)造成的句子邏輯混亂被饿。我自己說話時有一些陋習(xí)四康,像介紹流程、經(jīng)歷之類的事情時狭握,經(jīng)常會不自覺地就連著說很多“然后”闪金,這樣的陋習(xí)在說話的時候很可能是意識不到的,但轉(zhuǎn)為文字后论颅,就需要把它們刪除或改寫哎垦。除了“然后”,還有人會比較喜歡說“就是說”恃疯、“接著”撼泛、“接下來呢”,這種帶有連接事物先后順序的詞語澡谭。除此之外愿题,還有一些像說話語序混亂、無意識重復(fù)某些詞語之類的陋習(xí)蛙奖。
5)擔(dān)心語氣詞的情緒被錯誤解讀潘酗。用文字輸入的時候,我通常較少使用語氣詞雁仲,但說話時卻不可避免出現(xiàn)仔夺,例如:“呢”、“嘍”攒砖、“呀”缸兔、“嘛”等日裙。人在說話時,會沉浸在自己語調(diào)惰蜜、情緒的影響里昂拂,伴隨著情緒,語氣詞自然而然地脫口而出抛猖。但當(dāng)面對語音輸入的結(jié)果時格侯,說話時的情緒已經(jīng)消失了,那些帶有“呢”财著、“噢”語氣詞的句子 联四,卻難以重現(xiàn)說話時的情緒。這些不恰當(dāng)語氣詞的存在撑教,可能一不小心就改變了你的語言風(fēng)格朝墩,給你和上司的對話中帶來一些小災(zāi)難。
我們對語音輸入結(jié)果不是十分滿意的原因伟姐,除了技術(shù)層面的問題鱼辙,便是說話內(nèi)容不能在從口語到書面語的情景轉(zhuǎn)換中做到自適應(yīng)。
在社交聊天場景中玫镐,把交流的內(nèi)容稱作書面語可能有失妥當(dāng)。但在以往鍵盤輸入的過程中怠噪,我們大腦使用了書面語形成的方法恐似,所以內(nèi)容會更偏向于書面語的模式。而正是這部分書面語化的內(nèi)容傍念,跟語音輸入的口語化內(nèi)容存在的差別矫夷,造成了我們對語音輸入結(jié)果的不適應(yīng)。
組成的書面語和口語的材料來自同一個庫憋槐,但由于兩者對材料的篩選双藕、采納使用了不同的規(guī)則,所以組成口語和書面語的材料也是不盡相同的阳仔。詞匯上忧陪,口語詞匯簡單明了、通俗冗雜近范,書面語詞匯則富有表現(xiàn)力嘶摊,規(guī)范正式;句法上评矩,口語多使用簡單句叶堆、短句,結(jié)構(gòu)簡單直接斥杜;書面語則長句虱颗,復(fù)合句更多沥匈,語句結(jié)構(gòu)復(fù)雜。
口語形成時間短忘渔,且單向不可逆高帖,一旦通過聲音發(fā)出便是輸出的結(jié)果,即使后來進(jìn)行修改更正也不能在時空上對之前說過的話造成改變辨萍。而書面語形成是一個可反復(fù)回歸的過程棋恼,在文字輸出過程中,可以不斷檢閱修正锈玉,直至最后輸出書寫結(jié)果爪飘。
在口語和書面語系統(tǒng)中,如果在對方的環(huán)境里拉背,使用自己的語言規(guī)則师崎,便會帶來一種強(qiáng)烈的不適感。如果是在口語環(huán)境中使用書面語椅棺,就好像穿著正式的禮服出現(xiàn)在了運(yùn)動場犁罩。在每個人都在肆意奔跑的場景里,你卻挺著腰桿两疚,邁著謹(jǐn)慎的步伐床估,維持著禮貌的微笑,擔(dān)心襯不起今天穿著的那套禮服诱渤。反之丐巫,則是在宴會中穿著運(yùn)動服奔跑,隨意揮灑的汗水勺美、唐突的沖撞递胧、運(yùn)動鞋與地板的摩擦聲與會場的悠揚(yáng)樂聲自然是格格不入。
這兩種做法并不是說不可行赡茸,只是那種情景下帶來的不適感讓大部分人都望而卻步了缎脾。所以我們在語音輸入過程中,始終會對某些口語輸入的句子感到不適占卧,因為輸入后的結(jié)果變成了書面語遗菠,我們會不自覺地用書面語系統(tǒng)去檢閱這些結(jié)果。
與此同時华蜒,除了語言內(nèi)容外舷蒲,語言外因素也對內(nèi)容傳達(dá)造成了影響。語言外因素(無法通過語言傳遞的信息友多,例如:語音牲平、語調(diào)、視線域滥、表情纵柿、手勢等)對信息傳達(dá)也起到了重要的作用蜈抓。在書面語中,只有語言內(nèi)容是有用的昂儒;而在口語表達(dá)中沟使,語言內(nèi)容和部分語言外因素共同起到了作用。在語音輸入情景中渊跋,我們在說話過程會自動帶入自己的情緒腊嗡,這個過程有一部分語言外因素協(xié)助我們傳達(dá)自己的情緒,例如拾酝,利用停頓強(qiáng)調(diào)重要性燕少、高聲調(diào)表示憤怒、語速快表示著急蒿囤。但通過語音輸入被轉(zhuǎn)換成文字后客们,語言外因素攜帶的情緒便被消磨得差不多了,最終還是需要對這些經(jīng)過機(jī)器輸出的內(nèi)容進(jìn)行潤色修改材诽。
既然語音輸入存在現(xiàn)在的一些問題底挫,特別是在需要相對大量文字輸入的情境中,我們就更需要找到一些方法去更高效地修正語音輸入的結(jié)果脸侥,而不是在那個小小的輸入框建邓,用大拇指經(jīng)過數(shù)不清次的點觸、拖移睁枕、滑動官边,最后獲得的結(jié)果還是不如所愿。
在錘子發(fā)布會提及科大訊飛語音輸入的同時譬重,Big Bang 和 One Step 也亮眼無比。經(jīng)過大拇指一貼罐氨,Big Bang 就會把按住的文字“炸”開臀规,用戶就可以對文字進(jìn)行搜索、分享和復(fù)制的動作栅隐。Big Bang 帶來交互上的新體驗塔嬉,解決了人們在信息編輯上的痛點。錘子公司想通過這樣的方式租悄,讓手持設(shè)備在信息處理和識別方面上擁有比電腦還高的效率谨究。這樣的 Big Bang 自然可以對語音輸入的文字結(jié)果進(jìn)行一定程度修正。
在眾多應(yīng)用推薦平臺上中泣棋,留意到了一款叫做的 Clipboard Plus 的應(yīng)用胶哲。它的界面融合了Big Bang 和 One Step 的框架。通過復(fù)制動作潭辈,再點擊懸浮球即可進(jìn)入分詞操作界面鸯屿。
通過對大段文字進(jìn)行分詞處理澈吨,再篩選需要的內(nèi)容,最后再發(fā)送修改后的結(jié)果寄摆。Clipboard Plus 創(chuàng)造了一個獨(dú)立編輯修改文字的環(huán)境谅辣,充分利用屏幕空間,分詞邏輯婶恼,讓用戶在修改大段文字上減少了原本在狹小編輯區(qū)域內(nèi)的壓迫感桑阶,頓時感覺豁然開朗。同時勾邦,它的一些簡易操作蚣录,例如點擊“全選”可以進(jìn)行反選,在刪除少量錯誤詞語上可以說相當(dāng)方便检痰。修改后的語段可以通過點選分享欄中的應(yīng)用包归,直接進(jìn)行輸入、搜索铅歼、分享等動作公壤。
如果你想體驗一下這種不同于以往的文字編輯方式,可以在應(yīng)用商店通過搜索“Clipboard Plus”椎椰,免費(fèi)下載厦幅。
不得不說這類型的軟件為語音輸入結(jié)果的修正提供了不少方便,但針對實際使用場景慨飘,可能還需要增加信息置換确憨、插入、快捷選擇等的功能瓤的。但當(dāng)真有了這些功能時休弃,可能會變成一個臃腫的擁有分詞功能的文字處理應(yīng)用軟件。在未來圈膏,相信開發(fā)者塔猾、設(shè)計師們還會為此創(chuàng)造出更多優(yōu)秀的產(chǎn)品,去處理好信息的編輯處理與識別利用的問題稽坤。與此同時丈甸,手持設(shè)備的語音輸入也能因此而獲得更好的發(fā)展空間。