昭靈駟玉作品

第232章【一夜爆紅的神秘高手（二合一）】

 

    隨著遊戲進入對抗階段，羅晟期待滿滿的觀看娜芙的第一視角，看看錶現如何。

    這場對抗是[人族vs蟲族]，人類對手是一名蟲族玩家，而娜芙選擇的則是人族。

    遊戲剛剛開局，觀看娜芙第一視角的羅晟就感覺巨尷尬，因為“她”控制著四個農民在地圖晃悠了一圈，然後才回頭去採礦，持續時間大約半分鐘左右。

    得，開局就大劣。

    這還打泥煤，真是個人工智障。

    這一幕直接把羅晟看醉了。

    不明白的還以為“她”對這個世界充滿了好奇呢，果然是個人工智障。

    隨後，娜芙連續造了兩個房子，羅晟本以為“她”會把兵營建築放下去，然而“她”並沒有建造兵營。

    而是存了一筆錢去開二礦去了……

    觀看第一視角的羅晟突然覺得，娜芙現在的這些行為操作，就是個純新人第一次接觸星際爭霸這款遊戲一樣，沒有任何區別。

    隨著時間一分一秒的流逝，與之對抗的蟲族玩家前來偵察，看到對手的開局。

    蟲族玩家也看傻了。

    什麼鬼？

    這是什麼打法？

    於是爆了一波小狗過來，這個時候娜芙才剛剛造第一個機槍兵，還沒出來。

    隨著對手一波偵察部隊試探性進攻的小狗進入礦區，娜芙抵抗了一會無力迴天，最終打出gg結束了比賽。

    第一場對抗被對方一小股偵察部隊給打死了。

    其實對面的人類玩家實力並不高，只是一名普通玩家而已，想要遇到真正的頂級職業玩家，娜芙需要在天梯中不斷的對抗，戰勝一個個人類對手，每一次勝利都會匹配到更強的對手，直到登上金字塔頂端與真正的頂級職業玩家對抗。

    當然了，以羅晟的技術完全可以強行修改匹配系統的算法，讓娜芙直接匹配到頂尖玩家，不過他沒有那麼做。

    目前，星際爭霸這款遊戲是時下爆火的電競遊戲，玩的人超級多，尤其是韓國那邊。

    甚至有個誇張的說法，眼下在韓國，10-40歲的男子如果說他不會打星際會被瘋狂嘲諷。

    ……

    很快，第二局對抗開始了，這一次是tvt對抗局，即[人族vs人族]。

    到了第二局對抗，娜芙有了明顯的進步，這一局對抗雖然同樣輸了，但至少把兵推到了對手的家裡。

    一波主力全送掉之後，被對方機械化戰術反推回來。

    再次打出gg。

    下一把快速重開。

    ……

    當到了第五局對抗，又是tvz，也即是[人族vs蟲族]。

    接連輸掉比賽的娜芙，終於展現了“她”非同凡響的一面，其強大的學習能力讓“她”適應了這個水平的“tvz”對抗，並且輕鬆的以操作碾壓戰勝了對手。

    這一場對抗娜芙雖然以堪比頂級職業選手的操作水平把對手打敗，但其中一個細節就是“她”從來不會在相同的地方犯第二次錯誤。

    換個說法就是，娜芙的學習進步速度太恐怖了，每一次對抗對“她”來說都是學習。

    羅晟通過這五場與人類玩家對抗的比賽中也看到了娜芙暴露出來的一個缺陷，就是除了特定的分兵戰術，“她”並不能形成靈活的兵力分配。

    在輸掉的第四局對抗中，一名高水平的人類玩家對娜芙的基地不停的多線騷擾，而“她”一旦回防對方就立刻跑路，等“她”的兵出門展開進攻的時候又轉回來繼續騷擾。

    這場對抗，面對人類玩家的靈活出兵策略，娜芙只能被動應戰，無法形成對人類玩家的有效進攻，也導致了最後滾雪球效應起來了。

    最終落敗。

    第五局對抗結束之後，羅晟讓娜芙停止了匹配對手，然後對其重新進行了一次大幅的升級優化。

    他覺得這樣的學習效率仍然顯得太慢。

    娜芙的智能體採用的是深度學習算法，羅晟對其進行了一次精心升級之後，包括了神經網絡、通過強化學習的自我對弈，多智能體學習、模仿學習等算法或技術。

    其中所謂的自我對弈，簡單說就是自我學習，通過不斷的試錯找到讓自己勝率最大的遊戲方式。

    而通過自我對弈和強化學習，構成了開放端學習算法的基本範式，學習人的策略，並確保娜芙的智能體在整個遊戲過程中不斷探索這些策略，從而讓“她”獲得更大的升級與進步。

    此外，由於星際爭霸這款遊戲具有巨大的動作空間，會讓許多先前強化學習方法變得無效。

    羅晟因此還為娜芙開發了一種全新的算法進行非策略強化學習，使得“她”能從舊有的歷史決策的遊戲中有效的更新決策。

    而羅晟的終極目的可不是讓娜芙成為一個“imba”的星際爭霸ai玩家，而是以此為起點，讓“她”能夠勝任複雜多變的其它應用場景。

    如果“她”只是在星際爭霸的比賽中成為超級高手，換個場景，例如在圍棋、語言或其它領域就不行了，那依然是個純粹的人工智障，和真正的人工智能有著巨大的差距。

第232章 【一夜爆紅的神秘高手（二合一）】

第232章【一夜爆紅的神秘高手（二合一）】