2017年12月22日
アイデアよもやま話 No.3893 「アルファ碁ゼロ」が 「アルファ碁」に100戦全勝の意味するもの!

これまで「アルファ碁」についてはアイデアよもやま話 No.3344 人工知能が囲碁トップ棋士に勝利!などでお伝えしました。

そうした中、10月19日(木)付け読売新聞の朝刊記事で「アルファ碁」に100戦全勝した「アルファ碁ゼロ」について取り上げていたのでご紹介します。

 

アメリカ・グーグル傘下のイギリスのグーグル・ディープマインド社は、囲碁の世界トップ棋士を次々と破った人工知能(AI)の「アルファ碁」を上回る「アルファ碁ゼロ」を開発したことを明らかにしました。

AIのプログラムを改善し、従来の「アルファ碁」と違ってプロ棋士らの対戦データ(棋譜)を一切学ばず、自分自身の対局を繰り返して打ち方を独学するのです。

わずか3日間の学習で従来の「アルファ碁」に100戦全勝しました。

研究結果が10月19日のイギリスの科学誌ネイチャーに掲載されました。

 

従来の「アルファ碁」は、10万局以上のプロ棋士らの棋譜などを学んだ上で、自己対局を繰り返して勝率の高い手を学習しました。

昨年3月には、世界トップクラスの強豪、韓国のイ セドル九段に圧勝しました。

また「アルファ碁」の改良版は、今年9月、世界最強と称される中国人棋士、柯 潔九段を3戦全勝で退けました。

 

ディープマインド社は、「アルファ碁ゼロ」を開発するにあたり、従来の「アルファ碁」では別々だったネットワークを統合するなど、自己対局のみで効率的に学べる新技術を導入しました。

囲碁のルール以外は一切教えず、3日間で自己対局を重ねた結果、「アルファ碁ゼロ」は李九段を倒した当時の「アルファ碁」を100戦全勝で一蹴しました。

その後、約40日間の学習後は、「アルファ碁」の改良版にも89勝11敗で圧勝しました。

 

ディープマインド社のチームは、「この技術は、人間の知識の限界に制約されず、従来の「アルファ碁」より強力」としています。

同社の研究チームは、この技術の応用が期待される分野として、創薬に役立つたんぱく質の構造解析や新素材の開発、省エネ研究などを挙げています。

 

「アルファ碁ゼロ」は、囲碁の世界で人間が長年積み上げてきた知識が文字通り「ゼロ」でも、それを上回る実力を数日で身に付けられるというAIの可能性を示しました。

 

以上、記事の内容の一部をご紹介してきました。

 

まず、記事の内容から「アルファ碁」から「アルファ碁ゼロ」への改善点を以下にまとめてみました。

・AIのプログラムを改善し、プロ棋士らの対戦データ(棋譜)を一切学ばず、囲碁のルールのみを教えて自分自身の対局を繰り返して打ち方を独学したこと

・「アルファ碁」では別々だったネットワークを統合するなど、自己対局のみで効率的に学べる新技術を導入したこと

 

ここで注目すべきは、これまでは囲碁だけでなく将棋においても、ルールは教えずにこれまでの対戦結果を出来るだけ参考にして対戦方法を決定していたのに対し、「アルファ碁ゼロ」には囲碁のルールのみを教えて自分自身の対局を繰り返して打ち方や指し方を独学させたことです。

しかも、その結果、「アルファ碁ゼロ」は約40日間の学習後に「アルファ碁」の改良版に89勝11敗で圧勝したのです。

この事実は今後のAI開発、および応用のあり方にとってとても重要だと感じました。

 

「アルファ碁ゼロ」の基本的な考え方である、ルールを教えるだけで後は独学で学ばせる方式を社会の様々な分野に応用したらどうなるか考えてみました。

例えば、今最も危機的な状況にある北朝鮮とアメリカとの武力衝突の可能性を限りなくゼロにするための対応策を考える際に、以下のようなルールを定めます。

(ルール)

・武力衝突を起こさない

・相互の国民への影響を最小限に食い止める

・これまで以上に両国、あるいは北朝鮮の周辺国の暮らしが良くなること

 

この3つのルールを満たし、相互の保有兵器などの軍事力などいくつかの重要な前提条件をパラメーターとしてインプットして対応策を求めらたどんな答えをAIは出してくるだろうかと想像してみました。

「アルファ碁ゼロ」は「アルファ碁」と違って、人間の過去の経験を一切反映しないのですから純粋に論理的な帰結としての答えが返ってきます。

ですから、常識や過去の実績に囚われる人間では思いつかないような答えが期待出来ます。

 

一方、AIも所詮はゼロから物事を考えることは出来ないのです。

私たち人間が何か考えて欲しいことをAIにインプットすることによりAIは稼働し始めるのです。

ただし、AIが自身の出した答えをそのまま無条件に実施に移すとなるとそれは問題です。

やはりAIの答えを受けて最後にその答えに基づいてどう決断し、どう行動に移すかを決定するのは人間でなければなりません。

これが大原則です。

しかし、今開発中の全自動車のようにAIに全て運転を任せるという動きもあります。

そして、全自動車だからこそ運転免許不要で、高齢者でも身体の不自由な方でも誰でもが自動車で移動することが出来るようになります。

 

ということで、AIに対して何をどこまで任せるかという観点での議論が今後増々求められてくると思います。


 
TrackBackURL : ボットからトラックバックURLを保護しています