第十個小號角 作品

第170章 主動發起進攻(求訂閱)

    “眾所周知,人工智能的學習訓練是需要大量的數據的,只有從大量的數量訓練裡面,人工智能才能總結出規律和特徵。”陳神說道。

    “這也是為什麼人們說人工智能學習是舉百反一的原因。”

    “但是,在國內語言訓練資源的分佈是非常不均衡的,國內百分之九十以上的訓練數據都是中英對照訓練,其他語種的訓練數據是非常欠缺的。”

    “而想要用少量的資源訓練出一個優秀的算法模型對於國內外的友商來說,都是非常困難的。”

    “這也是為什麼國內中英翻譯的質量和數量遠遠超出其他語種的原因。”

    “但是各位應該都很清楚我們的優勢在哪裡……”

    說到這裡,陳神看向會議桌上的眾人,大家都不約而同地露出了笑容。

    用少量的資源訓練出一個優秀的模型。

    這種事情還有比他們更擅長的嗎?

    白澤算法分分鐘就可以教各位友商做人。

    陳神做了一個簡單的總結:“目前我們需要解決的就是第一和第二個問題,第三個問題反倒是我們攔住競爭對手的一面銅牆鐵壁。”

    接下來,陳神拉出一面白板,開始在上面寫寫畫畫。

    眾人一開始還不知道他在幹嘛,直到陳神寫完上半部分,開始寫下半部分,他們才發現了其中的端倪。

    “這是……”

    “這難道是解決前面兩個問題的技術思路?”

    一個李軍請來的ai翻譯專家託了託自己的眼鏡:“這好像是一種特殊的編碼器和解碼器思路!?”

    在傳統解決這個方法的思路里面,是用編碼器對詞句進行雙向編碼,大概可以理解為ai同時從需翻譯詞句的前面和後面開始閱讀,並進行編碼,最後再由解碼器把編碼解碼,產生出翻譯後的句子,並把結果輸送出去。

    這樣面臨之前看書的問題時,ai就可以知道在看的是書,而不是其他的東西,進而提高譯文的速度和質量。

    而在陳神現在寫出的思路里面,這是一種全新的編碼器和解碼器結構。

    這種編碼器結構極其複雜,但是可以看出它會全面考慮需要翻譯的文本,並且計算它們之間存在的聯繫,輸出對應的結果。