“ 文化交流溝通加速了地球文明的發(fā)展進(jìn)程”
01—硅基人影響向的地球文明
硅基人1_2號很有想法,他發(fā)現(xiàn)地球人的語言在形式上是線性的(語言或者語句是從開始到結(jié)束形成一個線性序列郭赐,無論是說出來還是寫出來都是如此)苍鲜,但是內(nèi)在語義卻是跳躍的慌洪、網(wǎng)狀的解总、互相關(guān)聯(lián)的川抡;word2vec只是試圖建模相鄰詞匯這種關(guān)系沸伏,在搭建地球子文明之間橋梁的時候,必定不是幾個詞就可以完成的磷斧;大篇幅的描述或者對話是難以避免的,所以應(yīng)該把地球人語言以語塊(即句子)編碼為一個向量捷犹,然后再將這個向量解碼為另一個語言的句子弛饭,實現(xiàn)序列到序列的映射(seq2seq),也就實現(xiàn)了不同語言之間的翻譯萍歉。
上圖中把“how are you ?”這個因為句子中的四個詞語(“侣颂?”也算一個)壓縮(encoder就是編碼壓縮)到“?”之后的一個向量中枪孩,然后在decoder層對上文解碼憔晒,生成(這個過程就是利用設(shè)計的模型結(jié)構(gòu)和對詞語的表示等,對翻譯之后的詞進(jìn)行預(yù)測蔑舞,原理是基本數(shù)學(xué)原理是計算條件概率)對應(yīng)的詞“你好嗎”拒担。
句子有長有短,每個詞的高維向量后面都需要有一個隱藏層神經(jīng)元做一些數(shù)據(jù)處理和激活函數(shù)的非線性操作攻询;硅基人再次對模型做了簡化:規(guī)定句子長度从撼,長的截斷,短的補(bǔ)0(在向量里面钧栖,不同維度都置為0或者置為某個特殊值低零,表示句子的平均語義或者不表示任何意思)。同時硅基人1_2號還巧妙地設(shè)計了自回歸這種模式拯杠。
【下圖“=”左側(cè)是自回歸結(jié)構(gòu)掏婶,右側(cè)是將此循環(huán)展開之后的結(jié)構(gòu)】:
所謂自回歸就是自我遞歸,在硅基人1_1號設(shè)計的神經(jīng)網(wǎng)絡(luò)里面每個輸入的背后隱層不共享潭陪,最后對各個隱層做一些處理然后輸出雄妥。硅基人1_2號設(shè)計的模型中允許序列中的各個字共享隱層。然后不斷地利用該隱層對當(dāng)前輸入和歷史輸入做取舍并激活畔咧,然后完成輸出茎芭,利用序列末端時刻的隱層狀態(tài)作為整個序列的表示,然后解碼誓沸,解碼的過程跟編碼的時候類似把上一個時刻的隱狀態(tài)和上一個時刻的輸出及上線文向量C作為當(dāng)前時刻的輸入梅桩,不斷解碼目標(biāo)序列:
現(xiàn)在,硅基人1_2號成功設(shè)計了理論上完全適用于翻譯的模型結(jié)構(gòu)拜隧,剩下的就是需要數(shù)據(jù)來驅(qū)動模型學(xué)習(xí)宿百。硅基人的探測游移于地球各個區(qū)域趁仙,基于不同語言有著共同的物理基礎(chǔ),加上對不同語言在使用時的場景垦页、表情等的比對雀费,硅基人尋找到了一幾大主要地球文明的語言之間大批平行語料,也就是標(biāo)注數(shù)據(jù)痊焊,再簡單點(diǎn)說就是一種語言及其在另一種語言當(dāng)中的翻譯盏袄,這樣的數(shù)據(jù)以句子對的形式存在。
硅基人的影響主要針對當(dāng)時的北半球薄啥。硅基人想通過這種方式(將不同語言所代表的的文化辕羽、文明翻譯成其他文明的文字,然后以著作和民間傳說的流傳方式垄惧,潛移默化地影響文明的探索和交流)擔(dān)當(dāng)不同文明之間橋梁的角色刁愿,加強(qiáng)地球各文明之間的交流和促進(jìn)。因為硅基人甚知到逊,閉關(guān)鎖國铣口、單獨(dú)發(fā)展難以進(jìn)化出更高等文明。
同時觉壶,由于地表文明處在發(fā)展初期脑题,對所處世界的物理認(rèn)識嚴(yán)重不足,各個文明對未知現(xiàn)象的解釋多訴諸于神明和宗教掰曾。為了使得硅基文明的計劃(讓地球各個子文明可以互通有無旭蠕,相互溝通,更快地達(dá)到可以與硅基文明共同進(jìn)化的水平)得以順利實施旷坦,硅基文明在當(dāng)時的地球文明各地創(chuàng)建了不同的宗教或者神話掏熬,宗教傳播的思想或書籍以及口口相傳的神話故事都是經(jīng)過硅基文明翻譯和修改之后以適合當(dāng)?shù)匚幕l(fā)展的形式出現(xiàn)。比如當(dāng)時地球文明的東方文明(中國)相對繁盛秒梅,軍事力量和農(nóng)業(yè)發(fā)展比較發(fā)達(dá)旗芬,硅基文明將東方文明的一些先進(jìn)的思想和科學(xué)文化技術(shù)進(jìn)行翻譯,并將翻譯之后的思想或者文化通過文明代理人(一般是宗教創(chuàng)始人捆蜀,受到硅基人的深度影響)疮丛,使之“頓悟”到這種番外文化,從而以宗教或者神話故事的形式傳播給大眾)傳播給本邦人類辆它。當(dāng)然誊薄,有時候不只是番外文化,也有超時代的文化和智慧锰茉。
慢慢地隨著時間的積累呢蔫,等到子文明發(fā)展到一定程度就會去探索神話故事的真相,同時飒筑,宗教中的善與美片吊、先進(jìn)與超自然也在某種程度上引領(lǐng)者本地文明的發(fā)展绽昏。在這種力量的影響下,當(dāng)時的地球各區(qū)域文明的確出現(xiàn)了文化與經(jīng)濟(jì)的交流俏脊,比如佛教的流傳全谤、西漢的絲綢之路、再到后來的鄭和下西洋爷贫;也有馬可波羅游記等對異域文化的描述和向往认然,更是直接刺激了本邦文化發(fā)展與文明擴(kuò)張。但是地區(qū)文明之間的交流和碰撞大多數(shù)以暴力戰(zhàn)爭的形式進(jìn)行著漫萄。比如幾乎同時期的幾個大帝國包括漢帝國季眷、羅馬帝國、安息帝國和貴霜帝國等卷胯。
張騫出使西域圖
貴霜國和漢帝國被高寒的帕米爾高原分割,兩個子文明多少年間少有交流威酒,正是在硅基人的影響下窑睁,貴霜國的人聽聞了漢帝國物產(chǎn)豐饒,人民生活富足葵孤,而且有著更先進(jìn)的科學(xué)與文化担钮;同時漢帝國民間也漸漸流傳西域并非皆是蠻夷,也有文明存在尤仍。時間來到了公元1世紀(jì)箫津,貴霜帝國和東漢產(chǎn)生了交集,即兩者在西域地帶發(fā)生過一次交手宰啦,但是這次交手卻并不是平和的交流促進(jìn)苏遥。西漢被篡奪后,王莽的新朝并沒有做出多少政績赡模,反而使得西域這塊地區(qū)成了無主之地田炭,在劉秀建立東漢后,由于百廢待興漓柑,于是對西域的態(tài)度和北匈奴一樣教硫,都是采取韜光養(yǎng)晦的政策,不過到了明帝辆布,章帝時期瞬矩,“吏得其人,民樂其業(yè)锋玲,遠(yuǎn)近畏服景用,戶口增強(qiáng),天下安定嫩絮,百姓殷富”丛肢,由此東漢開始在北方和西方均采取了行動围肥,而對這一切有著親身體驗的便是著名的班超,他既是漢人徹底擊潰匈奴人蜂怎,封狼燕然的見證人穆刻,也是恢復(fù)漢朝在西域都護(hù)的最大功臣,而漢朝的這些武功也讓當(dāng)時的另一個帝國有所忌憚杠步,那就是貴霜帝國氢伟,于是漢和帝三年,欺負(fù)漢朝孤兒寡母的貴霜帝國想要讓東漢和親幽歼,達(dá)成聯(lián)姻結(jié)盟朵锣,不過這種送女人保和平的事漢朝一向是很敏感的,最終雙方也有了一次交手甸私,貴霜帝國東越蔥嶺攻打班超诚些,不過最終班超堅守不出同時又設(shè)伏殺了貴霜帝國外出求援的使者,逼退了貴霜帝國皇型。貴霜帝國既然是東越蔥嶺打班超诬烹,其自然就是中亞的一個國家,因為過了蔥嶺即今新疆的帕米爾高原就是中亞了弃鸦,而其建立者正是當(dāng)年張騫出使西域所要聯(lián)合抗擊匈奴人的月氏人后裔所創(chuàng)绞吁,它的起步幾乎是與東漢同時的,因此東漢達(dá)到極盛的漢和帝永元年間也正是貴霜帝國的黃金期唬格,因此才這么有底氣讓東漢和親家破。不過其后來也和東漢一樣沒能強(qiáng)盛多久,最終中亞的領(lǐng)土逐步逐步丟失殆盡购岗,僅保留阿富汗汰聋,巴基斯坦一帶,公元五世紀(jì)被信仰拜火教的游牧民族徹底覆滅喊积。
同貴霜帝國一樣马僻,安息帝國起初存在感也不是很強(qiáng),不過相比于貴霜帝國同漢朝若即若離的關(guān)系注服,安息帝國對四大帝國中另一個的羅馬則是一個心腹大患韭邓。這正是由于漢帝國與羅馬帝國之間的絲綢之路的往來貿(mào)易催生的。安息帝國是一個由不同文化組成的國家溶弟,它在很大程度上吸納了包括波斯文化女淑、希臘文化及其他地區(qū)文化的藝術(shù)、建筑辜御、宗教信仰及皇室標(biāo)記鸭你。隨著安息帝國的擴(kuò)張,帝國首都的所在地也沿著底格里斯河由尼薩遷往泰西封,其他多個城市也曾成為首都袱巨。這也成為了硅基人語言影響的成功范例之一阁谆。但是安息帝國地處羅馬帝國與漢帝國絲綢之路的必經(jīng)之地,羅馬帝國與漢帝國往來的經(jīng)濟(jì)產(chǎn)品經(jīng)常被安息帝國扣下愉老,嚴(yán)重影響了羅馬帝國的利益场绿。亞歷山大征服波斯帝國后,建立了強(qiáng)大的亞歷山大帝國嫉入,亞歷山大死后焰盗,帝國的波斯部分由其部將塞琉古一世繼承,建立塞琉古王國咒林,不過國家很快又出現(xiàn)了分裂熬拒,帕提亞人在伊朗高原一帶獨(dú)立,并逐步蠶食四面受敵的塞琉古王國垫竞,最終連同在西面不斷蠶食的羅馬人一道澎粟,將強(qiáng)盛一時的塞琉古王國送入了歷史中,由此帕提亞人也和羅馬人成為了西亞的鄰居欢瞪,不過與羅馬人做鄰居是要承擔(dān)壓力的捌议,在這一點(diǎn)上曾經(jīng)被亡國滅種國土上還要撒鹽的腓尼基人應(yīng)該深有感觸,公元二世紀(jì)引有,羅馬帝國軸心時代的五賢帝時期來到,也基本宣告這場斷斷續(xù)續(xù)對峙了百年的民族戰(zhàn)爭即將進(jìn)入尾聲倦逐。五賢帝時期譬正,羅馬帝國綜合國力得到了很大的發(fā)展,而相比之下帕提亞的發(fā)展則陷入了瓶頸檬姥,而同時羅馬帝國又是一個經(jīng)吃遥“不小心”擦槍走火的鄰居,公元三世紀(jì)初健民,經(jīng)過羅馬皇帝塞維魯及卡拉卡拉父子倆的兩次重大打擊抒巢,帕提亞人終于走到了盡頭,伊朗高原的原主人波斯人最終抓住這個時機(jī)秉犹,送了帕提亞帝國(安息帝國)最后一程蛉谜,薩珊帝國的新君主踩著舊君主的頭顱登上了君王的寶座,完成了這片土地帝國的接力崇堵。
這種情況是硅基人沒有預(yù)料到的型诚。按照硅基人的計算,模型產(chǎn)生的文化影響會如同催化劑一般加強(qiáng)相鄰文明的平和交流與溝通鸳劳,進(jìn)而不斷地進(jìn)步產(chǎn)生更先進(jìn)文明狰贯。但當(dāng)融合與交匯發(fā)展到一定規(guī)模,暴力戰(zhàn)爭總會成為主旋律。而硅基人預(yù)測到地球文明未來在更大范圍內(nèi)實現(xiàn)文明共同演化的可能性極低… …
當(dāng)然了涵紊,除了對文化整體的影響傍妒,硅基文明還會隨機(jī)地影響各個子文明不同時期的極少數(shù)人的心智(通過影響腦電波影響意識),將硅基文明先進(jìn)的數(shù)理文明的種子撒在了地球文明的土壤摸柄,這種影響就像出現(xiàn)在夢境中的畫面颤练,亦真亦幻;這樣做也是做到符號人類的生物構(gòu)造(因為人類本來就會在夢境中產(chǎn)生一些奇怪的意識)塘幅,這也就是各個地區(qū)的文明在不同時期出現(xiàn)的超時代的人類昔案,歐幾里得、達(dá)芬奇电媳、牛頓踏揣、東方的老莊哲學(xué)皆出于此,而這種影響一直在持續(xù)匾乓。
此時身處遙遠(yuǎn)的獵戶座α星的硅基人地球探測分隊一直關(guān)注著地球的發(fā)展捞稿,他們開始思考是不是最初從語言切入的出發(fā)點(diǎn)就出了問題;另一方面拼缝,技術(shù)官也在隨著問題的產(chǎn)生和對優(yōu)化其模型結(jié)構(gòu)娱局。但是硅基人看到,地球文明的發(fā)展逐漸步入指數(shù)爆炸式發(fā)展的前夜咧七;這也正是硅基文明堅守地球與地球文明共同發(fā)展了大約兩千年的原因衰齐。地球文明在此期間經(jīng)歷了農(nóng)業(yè)文明到工業(yè)文明的過渡,而且預(yù)計這種文明的升級迭代速度會越來越快继阻。時間來到了公元十九世紀(jì)耻涛,這個時候的地球人已經(jīng)開始探索電、磁與太空瘟檩,麥克斯韋等一批影響地球人類歷史的角色登上舞臺抹缕。
麥克斯韋夫婦
雖然暴力沖突多有發(fā)生,但是從結(jié)果來看墨辛,地球文明的確在融合與交流中獲得了質(zhì)的飛躍卓研。硅基人決定再次派出星際飛船
02—掉書袋
【1】 上述情述是對seq2seq和LSTM(Long-Short Term Memory)的簡單演義介紹,其中seq2seq是個通用模型睹簇,其實現(xiàn)多基于RNN(Recurrent Neural Network)這種網(wǎng)絡(luò)結(jié)構(gòu)奏赘,而LSTM是RNN的一種優(yōu)秀的變種。
【2】seq2seq在語言翻譯任務(wù)上效果較好太惠,實踐過程中還有諸多trick志珍,這里不做贅述;seq2seq也可以稱為:enc-dec模型或encoder-decoder模型或編解碼模型或端到端模型垛叨,除了結(jié)構(gòu)上天然的適合做翻譯任務(wù)伦糯,其中間狀態(tài)(encoder的輸出)可以拿出來作為句子的表示柜某,所以后續(xù)還有更加優(yōu)秀的模型基于encoder-decoder模型做表示學(xué)習(xí)。
03—參考文獻(xiàn)
1. LSTM詳解:https://colah.github.io/posts/2015-08-Understanding-LSTMs/
2. Sutskever, Ilya, Oriol Vinyals, and Quoc V. Le. "Sequence to sequence learning with neural networks." Advances in neural information processing systems 27 (2014).
3. Fabbri, Mirco, and Gianluca Moro. "Dow Jones Trading with Deep Learning: The Unreasonable Effectiveness of Recurrent Neural Networks." Data. 2018.
4. Hochreiter, S, and J. Schmidhuber. “Long short-term memory.” Neural Computation 9.8(1997):1735-1780.