GPT生成的文章總會有股很濃的AI味懒震,如何去除AI味變成了一項非常有意思的研究,這里分享一下前段時間的一些研究結果荞胡。
什么是AI味?
想要更好的去AI味了嚎,那首先必須明白硝训,什么是AI味。很多時候這都是一種只可意會不可言傳的東西新思,但是我們要去AI味那就必須搞清楚AI味的來源窖梁。
常用詞差異
首先最明顯的就是常用詞差異。
知名論壇 Reddit 上有網(wǎng)友發(fā)出了一個常用詞差異文章夹囚,其中臭名昭著的 Delved 以超過人類使用頻率 300 倍而記錄在案纵刘。差距最高的 reimagined 以 1000 倍人類使用頻率榮登榜首。
毫無疑問荸哟,因為固定訓練語料的問題假哎,導致某些詞被 GPT 偏愛而大面積使用是目前AI味的重要來源。雖然我們大部分人不是英語母語人士鞍历,但是看多了 GPT 輸出的內(nèi)容后舵抹,也能一眼就能看出來濃濃的AI味。
而目前主流的去AI味的網(wǎng)站也把常用詞替換作為去AI味的重要手段劣砍。隨便搜一些網(wǎng)站惧蛹,使用后就能看到幾乎百分百會把 Delved 這個詞給替換成其他同義詞。
所以去除AI味的第一步,就是找到AI高頻使用的詞匯香嗓,并加以替換成其他同義詞迅腔。
當然了,高頻詞匯并不是那么好搜集靠娱,并且很多時候你還要對比著人類的輸出內(nèi)容來進行頻率上的判斷沧烈,并不是你拿著GPT輸出的內(nèi)容一頓統(tǒng)計后就能完美解決。當然像云,很多時候我們并非追求100%锌雀,只要你開始去統(tǒng)計這些內(nèi)容并針對性的進行替換后,就會有立竿見影的效果迅诬。
常用句式結構
The early morning air was crisp as I walked into the sleek, glass-walled office of KPMG for the first time.
I had been chosen to participate in a comprehensive financial analysis project, an opportunity that promised to sharpen my skills and broaden my understanding of the auditing world.
That moment, standing in the brightly lit conference room, the cityscape visible through the floor-to-ceiling windows behind me, filled me with a sense of accomplishment and purpose. It was a testament to the power of diligence and analytical thinking, qualities that are crucial in the field of auditing.
先來看看一些AI輸出的經(jīng)典句式汤锨。
說實話,當我拿著上面這些內(nèi)容給老板審閱時百框,我的十個腳指頭已經(jīng)緊張的蜷縮在了一起。真的太尷尬了牍汹,尤其是最后一段那種積極向上的總結和外向拓展,我真的幾乎在每一篇AI生成的內(nèi)容中見到過。
(當然结闸,不同領域和目的的文章课幕,常見內(nèi)容會不太一樣。)
這里總結一下露该。
- AI特別喜歡使用“這一刻” “那是一個特別的日子” “我記得那天天氣明媚” 作為起手式睬棚,銜接一個場景描述作為過渡內(nèi)容,然后打出一招場景與心境互相配合的掌法解幼,最后上升價值作為終結技結束連招抑党。
- AI特別喜歡使用倒裝∧彀冢“房間里只有沙沙的聲音底靠,那是人們翻動書本的力量” “我來到了一個游樂園,這里充滿孩童的歡笑特铝,是治愈我內(nèi)心的良方”暑中。
當然,我總結的內(nèi)容只是某一方面鲫剿,更多的還需要大家來進行補充鳄逾。
針對這些常見的句式結構,我觀察了很多 Humanizer 網(wǎng)站灵莲,都沒有經(jīng)過特別的處理雕凹,并且同樣的句式經(jīng)過了網(wǎng)站的優(yōu)化后,居然神奇的能在檢測網(wǎng)站上通過。這些是我覺得目前檢測網(wǎng)站并沒有做好的地方请琳,合理猜測粱挡,目前的檢測應該還是基于第一部分,即常用詞上俄精,進行的檢測询筏,并沒有深入到句式理解上。
就我自己來說
- 首先我禁用了起手式竖慧,嚴格規(guī)定AI必須以細節(jié)場景為開頭嫌套,然后讓AI不要動不動就進行總結,算是禁用了終結技圾旨。不過誠實的講踱讨,依然存在比較濃的AI味。
- 這里我嘗試過讓AI不用倒裝句砍的,但是效果不好痹筛,所以最后給了例子進去,發(fā)現(xiàn)這樣的輸出變少了廓鞠,但是依舊不能消滅帚稠,只能說就閱讀感受來說好很多了。
總結
以上就是目前我自己去除AI味的辦法床佳。
其中替換常用詞的方法滋早,最好結合不同的模型進行輸出,比如我自己砌们,初始文章是使用 GPT4o 輸出的杆麸,優(yōu)化文章是使用的 Claude3.5 輸出的。目前來說主流的檢測網(wǎng)站浪感,如zerogpt.com昔头,測試下來,基本上AI率都下降到了10%以下影兽。
想要常見 AI 詞表的同學减细,點個關注,并進行評論赢笨。