「DQN」というグーグルが開発したゲーム攻略の人工知能(AI)とは?

「DQN」というグーグルが開発したゲーム攻略の人工知能(AI)とは?

LINEで送る
Pocket

一大潮流となった人工知能(AI)

スマートフォンやアプリなどの話題がピークアウトし、去年から人工知能の話題が増えている印象があります。

例えばソフトバンクが開発した人型ロボット「ペッパー」、チェスの名人を打ち破ったIBMの「ワトソン」、アップル社のアイフォンなどに搭載されている「siri」など。

各社この人工知能(AI)という分野で主導権を握ろうと、切磋琢磨しているのがわかります。それもIT業界の主力プレーヤーたちが。

そして今回はグーグルが開発したとされる、「DQN」という人工知能がこれまたすごい。

グーグルが開発した「DQN」とは、画面出力と「スコアは高いほど高評価」ということだけを教え、ゲームを繰り返しプレーしていくなかで自ら学び、高得点を取る秘訣を編み出していく、まるで人間の成長を体現したかのような人工知能という特徴がある。

下記映像は「DQN」が実際に「ブロック崩し」というゲームを繰り返しプレーし、上手くなる様子の映像。

上記の「ブロック崩し」というゲームでは、初めは飛んでくるボールを上手く打ち返せない状態でしたが、プレー回数が増え、200回となるとコツを掴み打ち返すようになり、400回になると取りこぼすこともほぼなくなるなど、まるで人間がプレーしているかのように成長していっています。

そして驚くのが、600回のプレー回数を越えた辺りからで、はじめに「ブロック崩し」の両端を集中的に崩すことで、効率的にブロックが崩れていくという必勝法を編み出し、上手く実行できる技を身ににつけていること。

今回この「DQN」に与えたゲームはレトロゲーム機 ATARI 2600 のゲーム49タイトル。そのうち、29タイトルで人間のプロゲーマーと同等または上回るパフォーマンスまで上達したと言います。

(スペースインベーダー、クレイジークライマー、パックマン、Qバート、ロードランナー、アステロイド、シューティングゲーム「River Raid」、ボクシングゲーム「Boxing」、3Dカーレースゲーム「Enduro」「Breakout」や「Pong」など)

「DQN」は人間のように成長し、人間と違い疲れを知らず、感情や集中力の波などもなく黙々とプレーし続けることができ、人間を超えていくというのも頷けます。

しかし「ブロック崩し」などのシンプルなゲームでは、理解が早くどんどん成長していきますが、パックマンなど「モンスターから逃げながらエサを食べ、パワーエサを取れれば一定時間モンスターに逆襲できる」というより複雑なルールは、「DQN」にはまだ理解できないようです。

[スポンサードリンク]

IBMのワトソンとgoogleのDQNとの違い

グーグルが今回開発したのは、コンピューターが一から学習によって自ら賢くなる「深層学習(ディープラーニング)」と呼ぶ最先端の人工知能。

IBMのワトソンは、そのプログラムに一流のチェスプレーヤーの知識を入れて実行するといい、グーグルの人工知能「深層学習(ディープラーニング)」との違いは明らか。

例えば、IBMのワトソンは大人が赤ちゃんや子供にいろいろと教えて成長させていくのに対し、グーグルのDQNは赤ちゃんや子供におもちゃを与えただけで使い方を理解し、上手く使えるように成長していくという驚くべきテクノロジー。

人間が教えなくても大量のデータや経験から精度を高めることができ、人間を上回る能力の獲得も可能で、将来はロボットや自動運転車など次世代技術に幅広く応用が期待されている。

加えて、プログラムの設計者自身が解決法を知っている必要はなく、人間ができないことも可能になるという、我々からすると恐ろしさも感じられるほどの、可能性を秘めている。

これからも「DQN」を始めとする人工知能には注目である。

【参考】
engadget
日本経済新聞

【関連記事】
人工知能とは!?人工知能とその可能性
IBMが開発した人工知能「ワトソン」の凄さとは!?ソフトバンクとの提携

[スポンサードリンク]

LINEで送る
Pocket