閑評谷歌GNMT翻譯的重大突破:職業(yè)翻譯不可替!
國慶節(jié)前,谷歌發(fā)布一條重大新聞:谷歌重磅推出其新一代神經(jīng)機器翻譯系統(tǒng)(GNMT)(ArXiv.org/《Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》),還宣布將 GNMT 投入到了非常困難的漢語-英語語言的翻譯生產(chǎn)中,引起了業(yè)內(nèi)的極大的關(guān)注并在一時間似乎使眾多“職業(yè)翻譯”們有了自己即將被替代而失業(yè)的驚慌。
驚呼之余,我們先來看看該 2.0 翻譯工具的“能耐”到底如何,以下為谷歌翻譯在其發(fā)布新聞里貼出的例證:
對此,網(wǎng)友們都炸了,特別是學(xué)翻譯的小伙伴們:
@猞猁與兔猻
作為一個翻譯,看到這個新聞的此時此刻,我理解了18世紀(jì)紡織工人看到蒸汽機時的憂慮與恐懼……
@李某正在潛逃
換言之···做翻譯的人現(xiàn)在開始要被第三次工業(yè)革命淘汰了?
@咖喱枝葉
外語系大學(xué)還沒畢業(yè)的開始害怕
@帥_路
畢業(yè)論文英文版有救了!
其實,在該上線新聞發(fā)布后,谷歌還專門發(fā)文詳細(xì)介紹了自己最新的神經(jīng)機器翻譯系統(tǒng)(GNMT),以及新系統(tǒng)的工作原理。
文章很長,其重點就是,該新的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN:Recurrent Neural Networks)與十年前發(fā)布的 Google Translate(谷歌翻譯)的核心區(qū)別,就是兩種系統(tǒng)背后的核心算法有所升級,簡言之,老系統(tǒng)是基于短語的機器翻譯(PBMT: Phrase-Based Machine Translation);而新服務(wù)在一定程度上采用了以句子為基本單元的翻譯。
在翻譯能力效果上,谷歌宣稱, GNMT 系統(tǒng)得出的翻譯相比于之前基于短語的生產(chǎn)系統(tǒng)有了極大提升,且GNMT 在多個主要語言對的翻譯中將翻譯誤差降低了 55%-85%, 甚至更多。
作為一名斷斷續(xù)續(xù)涉足翻譯界十余年的老兵(曾供創(chuàng)立并經(jīng)營專業(yè)法律翻譯公司-上海元兆),對上述業(yè)界重大突破,也在第一時間進(jìn)行了關(guān)注。
對于谷歌列出的例證,個人覺得,翻譯效果還是相當(dāng)不錯的,但是,該例證中的 source sentence 似乎過于簡單,待譯段落中的文意也基本屬于標(biāo)準(zhǔn)的敘述式,這對理解原文及翻譯重述的難度均很少,即系統(tǒng)在翻譯時,對原文的理解基本沒有困難,翻譯重述時也需要將前后句子拆分后重構(gòu)譯文,以此為例,應(yīng)該是官方精心安排,Google Translate 團隊的小伙伴們也是蠻“敬業(yè)”的!
但是,如果將 source text 換作是復(fù)雜的段落,情況又會如何呢?
根據(jù)我們十多年的翻譯經(jīng)驗及體會,好的專業(yè)翻譯過程應(yīng)達(dá)到兩點基本要求:1)準(zhǔn)確理解原文;2)專業(yè)準(zhǔn)確表達(dá)重述原意。其中,第1項要求是準(zhǔn)確翻譯的前提,否則,譯文將會是無源之水并繆以千里;第2項要求則是在譯文的再生,準(zhǔn)確表達(dá)原意是第一層次的要義,表達(dá)可讀且專業(yè)嚴(yán)謹(jǐn),即達(dá)到目標(biāo)語言的作家或?qū)I(yè)人士的文筆水平則是第二層次的目標(biāo)。
縱觀 Google Translate GNML 的更新功能及效果,無論其與十年前的老功能有多大提高,其討論的范疇仍局限在“準(zhǔn)確”的基本層面。從其例證中的譯文也可以很明顯的看到,譯文的段落的組織性及可讀性基本難以直視。
結(jié)合我們團隊的核心業(yè)務(wù)-法律金融翻譯來看,鑒于 source text 本身的復(fù)雜專業(yè),句式冗長、段落之間邏輯關(guān)聯(lián),專業(yè)術(shù)語眾多,一般行業(yè)中人尚難準(zhǔn)確理解融通,對于 GNML 來說,將始終難以跨越;在表達(dá)重述方面,由于法律文本的翻譯轉(zhuǎn)換還涉及到兩種法律文化的差異及人工技巧的解釋嫁接,有時,譯者還必須立足于篇章段落的層面進(jìn)行語句順序調(diào)整,甚至對個別段落的順序進(jìn)行適當(dāng)變換,以使譯文能夠達(dá)到目標(biāo)語言專業(yè)人士的起草水平及風(fēng)格,進(jìn)而消除令目標(biāo)語言受眾難以忍受的“翻譯痕跡”(注:很多專業(yè)客戶在委托了不合格的法律譯員進(jìn)行翻譯,但事后卻發(fā)覺這些公司的翻譯質(zhì)量根本達(dá)不到其要求,原來還基本看得懂原文,但拿到這些公司交付的中文譯稿時,卻看不懂了)。
綜上,我們認(rèn)為也同意,機器翻譯在進(jìn)步,但在可預(yù)見的未來,恐怕也只能局限于一些簡單領(lǐng)域的短段或語句的翻譯,對于不太重要的文件來說作個參考,了解個大意而已。對于專業(yè)極強且對客戶自身意義重大的文件(比如,法律合同),絕非 Google Translate 或隨便一家翻譯公司能夠勝任的。
最后,我想用 Google Translate 關(guān)于GNMT 的評估報告中的一句話來結(jié)束:機器翻譯還遠(yuǎn)未得到完全解決。GNMT 仍然會做出一些人類翻譯者永遠(yuǎn)不出做出的重大錯誤,例如漏詞和錯誤翻譯專有名詞或罕見術(shù)語,以及將句子單獨進(jìn)行翻譯而不考慮其段落或頁面的上下文。
如果有人問我(作為職業(yè)法律翻譯譯者)對于谷歌神經(jīng)機器翻譯系統(tǒng)的看法,我會說,點滴進(jìn)步,不足為懼。
本文為個人觀點,不代表其供職單位立場。如需轉(zhuǎn)載,請注明出處。
- 上一篇:留學(xué)移民去哪家強?美國,加拿大和英國綜合大比拼 2016/10/19
- 下一篇:這幾類人申請移民加拿大,拒簽率近乎100%! 2016/9/30
