DVD分析131「作戦タイム」
いよいよ最終話はドルアーガを倒す話になる。この回は、本当に苦労して時間内の納めているのがわかって、見ていてもったいなかった。まず、オープニングがカットされていたしね。
アーメイとニーバを失って、ドルアーガの行動範囲から離れて作戦会議を開く。カーヤが一度だけ障壁を消せるとは言っても、虚無の矢のような決定的攻撃手段がない状態で、ジルはダメージが与えられるのであれば、希望はあると考えていた。
カーヤ「ただし一度だけです」のセリフの後に、本来なら
ジル「でもダメージを与えることはできる。まずはそこから考えよう」
と来て、メルトやウトゥの否定の言葉になる予定だったらしい。
メルトの「前と同じだ」という部分も、ファティナの「攻撃力も・・・」の部分も、流れがわかる範囲で削られているが、逆に遠藤としてはテンポがよくなっていて好判断だと感じた。
地形を利用する理由の中には、隠れられる場所もあるからとジルは考えたらしい。この回の冒頭にも出ているが、ドルアーガに近付けない理由の1つに、尾を振り回されるだけで一方的にやられてしまうという危険があるからだ。この辺は賀東さんがモンハンやってるから・・・と勘ぐりたい(笑)
それと、チャンスが1回だけというのには、全員が消耗し切っていて、最大攻撃力を集中できるのは最初の1回だけであり、障壁を消せるのも一度だけだからという裏付けがある。ドルアーガを倒せる唯一のチャンスは、障壁のない時間帯に与えられる限りのダメージを与え、それが相手の致死量を上回ること。それができなければ全滅なのだが、何もしなかったとしても生存の可能性はどんどん低くなるので、できる限りの罠を上階に用意して、ドルアーガを誘うしかないわけだ。
良い作戦だとほめるケルブが、アーメイを見やって涙を見せる。ケルブは尻上がりに評価を上げたキャラだけど、アーメイを見やったときに「アーメイの仕込みがよかった」というセリフは、コンテの段階ではなかったので、分かりやすくするために追加されたのだろう。直球だが、ドラマの深みがわかりやすくなってグッとくる。
さらにこと後、二人がジルを見て「それとも天賦の才か?」と振る予定もあったらしい。でもジルは才能があってここまで来たわけではなくて、勇気と素直さとあきらめの悪さが持ち味なので、天賦の才説は却下されたのだろう。これもジルというキャラに合わせたら当然の結果。
そしてジルは自分が囮になると言う。「マジかよ」というウトゥのアドリブは、このシリーズでは定番になってるね。
「頑丈さには自信がある」というセリフに続いて、カーヤが「もっと安全な方法はないのか」と返し、ジルが「ガーディアンとしての責務を実行するだけ」みたいに答えるやりとりがコンテ段階から落とされている。「ガーディアン」という言葉は第1話からジルの役目として使われているので、首尾一貫という意味ではよかったのだろうが、このシーンで囮に最適なのはジルだと誰が見てもわかる。
- シマノ(SHIMANO) オトリ缶
- ¥17,960
- Amazon.co.jp
DVD分析130「ジルの決意」
第11話の終わりで、ドルアーガを倒すために天空の宮に入った人間は、ニーバ1人を除いて一同に集まり悲観的になる。
ニーバの脱落、アーメイの死亡によって、宮内に入ったチームの中で欠員がいないのはウルク軍だけなのだが、彼らに打つ手はない。
「障壁は消せます」とカーヤは先ほどまでの戦闘での力関係を知りながら伝える。この石板にはどんな力があるのかは判然としない。カイを封じ込めていた石板なのだから、亜神クラスの存在を封印することはできるはず。ドルアーガはそれ以上の存在なので、直接封じることはできないのだろう。
カイを封印していた力の源が誰にあるのかで、その効果を考えると、この石板は幻の塔を統べている誰かに由来するのだろう。ゲートキーパードルアーガも同じ存在がコントロールしていると思われるので、敵対した存在ではないから封印ができない、とも言える。
ドルアーガの障壁は、その力と同列と思われるので、石板の力を負の方向に利用することで、消すことが可能だと解釈しよう。
自分を責めているジルを導くためにカイが現れる。カイの言葉によると、「みな、もう勝てない、後は死ぬだけだ」と思ってるらしいが、カーヤは望みを捨ててなさそうだし、カイがそんなカーヤではなくジルに何かをさせたがっているのは、ジルが唯一の希望だからではないか?
「どうしたい?」「望みは?」「何になりたい?」と問われたジルだが、必要なのは「覚悟」なのだろう。そんなジルに生き様を見せて戦うことの厳しさを教えたアーメイ、その最期の言葉「あきらめるな!」が塔の真実を知らないにも関わらず、ジルの曖昧さを消す。
身近な者が死んで、自らも死の可能性と向き合って、というのは極端だが、男の子ならどこかで覚悟を決めないとダメなシーンがやってくる。そこから逃げてしまうと人生の落伍者になってしまうのは、現実も変わらない。
エンディングでは「盾なんかいらない」と歌うジルだが、あの歌詞が作られた頃は、こんな結末になるとは予測していなかったのかも知れない。「それでも僕は盾になりたい」逆にエンディングへのカウンターなのかな(笑)
やっと自分のシナリオに乗ってきたと言わんばかりのカイの笑顔。第2期では、このカイが実体化してジルたちを恐怖とお笑いのズンドコに誘うとか。アニメ雑誌とかで発表されているカイを見ると必要以上に小さくて、さすがの幼女好きな一部のアニメヲタでも萎えるかと・・・。
とにかくジルの立ち上がるのを一同は待っていたんだと思う。何せ「龍殺しのジル」なわけだし、ケルブとのコンビネーションなら、ドルアーガの刺棘も対応できるに違いない。それにしても・・・ウトゥがんばれよ!
- HANWEI 1069-GT 中世インベラリー円盾
- ¥20,160
【MMOドルアーガoff】12/28(日)にやります
MMORPG「ドルアーガの塔/the Recovery of BABYRIM」のプレイヤー限定でオフ会を開きます。会の趣旨としては、やっとレベル20になったものの、岩穴で全滅してゲージが紫になってしまった、へたれプレイヤー遠藤のグチをみんなが「うんうん」と聞く会(笑)です。
期日:12/28日(日)夜帯
場所:山手線内あたり
参加資格:MMORPGドルアーガの塔のプレイヤー
優先参加資格:遠藤のブログにて紹介させていただいた方々
マサキ・アンドー
ティナ・ブランフォード
アイーシャ
ふある
八菱律子
Mi
アィーダ
ナデシコ
E6850
アムネリア
らぶしゃん
オリベルテ(来ねぇよ!)
女郎花
マート
大月瑠璃
yuyaXXG
Karla
☆あっこ☆
びー760
あさぎあい
サンドライト
グリン=ピース
ディーナ・エブルン
コソドロ
無茶しない
愛香
MIRROR/G(「GIL」の名前でコメントくれた人)
ろじゃ~
みじゅんこ
ユーミ
がちゃ
ドレッド
シン・カインド
ティンキィー
lumin
バティ
リアーナ
はるぷう
Emerald
参加の覚悟:遠藤と一緒に撮った写真を、ハンドルと共にこのブログに晒します。また、実名の名刺を交換してください。
参加を希望される方は、こちら
までメールで意思表明してください。フリーメールとか逃げ腰な人は相手にしない可能性があります(笑)人数が多くなると話が通らなくなるので、本当は6人までと言いたいのですが、さすがにそれだとオフとして寂しいので、遠方から来られる人を優先して+αしたいと思います。場所を確保するのが面倒な場合、人数が多ければ極寒の屋外オフにする気満々だったりもします(笑)
こんなワガママなオフには誰も来ないかも知れませんが、それならそれで一人でデッカイのこぎりに向かって「紫ゲージのバカァ!」と怒鳴って過ごします。
DVD分析129「無策のウルク軍」
最大戦力であったウルク軍は、最も塔頂率の低いグループとなった。
ゲートキーパードルアーガを目の当たりにして、なす術なく傍観者となるウルク軍。ウルク軍には先行して仕掛けなければならない理由はない。ドルアーガを倒し、ブルークリスタルロッドを手に入れて単に願いを叶えようとするグループなら、人より先にブルークリスタルロッドを手に入れなければ意味はない。しかし真の目的を考えると、願いを叶えようとしているグループは1つも天空の宮まで残れていない。
ウルク軍の目的はドルアーガ討伐にあるので、他のグループがその目的を達成したとしても、自分たちの消耗がないので効率よく目的を果たしたことになる。それゆえの様子見なら意味もあるのだが、ウルク軍が仕掛けられないのは、対ドルアーガ戦の決定的な対策がないからだ。
ここまで到達した魔法兵は2人。ウルク軍の戦い方は数に物を言わせるものなので、魔法兵の数によって取れる戦略が違うという考え方もある。
・ドルアーガの魔法障壁を破る
・ドルアーガの動きを止める
・ドルアーガを魔法で倒す
これらは魔法兵の数が充分ならイケたのだろうか?遠藤の答は「No」、これができるくらいだったら、片羽など楽勝で倒せたに違いない。
で、できたことは閃光魔法によって、アーメイを失って動きの止まった塔頂者たちを回収すること。
エタナは一番にジルを認めてくれた軍の人間なので、ここで塔頂者たちを援護する決断を下したのはエタナだろう。ケルブもジルには特別な思いがあるはずだし、アーメイを見殺しにしたのではオーウェンに顔向けできない、それ以上に他にできることもないので助けたのだろう。軍の目的を考慮しても、正しい判断だと思う。
撤収した一行は安全地帯とも言える階上で、今後についてを話し合う。兵士も鎧を外してここに加わっている。立場を考えるとケルブが最上位になるのだが、ここでは広く意見を求めて、出来る限り生存に道を探ろうとしているではないだろうか?
- 紅い閃光が歯を治療!?『NEW フォト センシティ』
- ¥4,179
- いいものショップ
DVD分析128「アーメイ最期の言葉」
カーヤの力によって、最期の言葉のチャンスを与えられたアーメイ。
この場にケルブがいないのはちょっと合点がいかない。いくら杓子定規な軍の司令官と言えども、オーウェンやアーメイとの関係を考えると、ちょっと冷たい。その後のケルブ隊長の行動については、第2期で明らかになるだろうが、少しはアーメイとオーウェンのことを思い出すのだろうか。
ウルク軍の一員として登ったことのあるアーメイにとって、クーパが同じパーティーだったことは生活に潤いを与えていた。第2期ではクーパが戦士として覚醒している可能性もある。武器はウォーハンマーにしてほしいけど、そこを外す賀東さんでもないだろう。でっかいハンマーをブンブン振り回すクーパ・・・ないかな(笑)
アーメイの死を前にしても自己中心的なメルト。第2期では人を思いやる人格者になって、クーパとの仲も違ったものになっている?
カーヤの目的を考えると、一人で背負い込むなと言われても正すわけにはいくまい。第2期でのカーヤのコスチュームが変わっているのだが、幻の塔の中にも居留地があって物資が調達できるのだろうか?だとすると、そこに居住しているのは人間?それとも天界の人?原作から引用するのであれば、ラマン神の指揮下にある半神族あたりが居るのかも知れない。
ジルはアーメイから何かを受け継いで成長することを強要される。優柔不断で八方美人なジルにしてみれば、迷惑な話かも知れないが、人が亡くなる時の言葉の重みは、人の一生を左右するに足るのが世の常だ。なのに第2期ではごくつぶしになってるらしい、アーメイに顔向けできないぞ!
出血多量で敗血症を起こしているせいか、多分脳の血流が充分ではないのだろう、記憶が混濁してあらぬものが見えている。生物には、万が一の時に苦痛を軽減するような機能があるが、それは最期を幸せに終わらせてくれるシステムでもある。ただしこれは、即死の時には働かないので、カーヤの努力は結果的にアーメイを幸せにしたことになる。
- プラチナ ペアリング PT900 結婚指輪
- ¥163,800
- Jオリジナル
【DiGRA公開講座】モンテカルロ木探索とは何か?
2008年は囲碁の思考プログラムが急速に進化した年だった。その原動力となっている「モンテカルロ木探索」いわゆる「モンテカルロ法」について、
伊藤毅志・電気通信大学情報工学科助教
美添一樹・科学技術振興機構研究員
山下 宏・囲碁AI「彩」プログラマ
の3氏を講師に招いて紹介いただいた。その内容を遠藤なりにまとめてみたので、ゲームのAI作りの参考にしてもらいたい。
--------------------------------------------------
◆人口知能とゲームの親和性
チェスは欧米では「知性の象徴」としてのステイタスがある。例えば「2001年宇宙の旅」に登場するHALはチェスをするということで、知性を持つと表現をしている。
このチェスの思考プログラム、いわゆるAI(Artificial Intelligence/人工知能)は、AI研究の黎明期から盛んで、1840年から解析が始まっているが、1960年代後半から短時間で大きく進化を遂げている。
チェスをはじめとする古典ゲームは
・ルールが明らかである
・勝敗が明らかである
・馴染みがある
・プレイヤーが多く、強さを測る尺度がある
などの理由で題材として扱いやすく、
・情報探索
・推論
・知識データベース
・データ探索
・機械学習
・ニューラルネット
など、認知科学上の理解・問題解決・思考・教育のエッセンスも持つ。そのため、色々なゲームでAIが考えられている。
特に、1対1で交互に1手ずつ進めていく「ターン制2人対戦」、トランプの手札などのように隠蔽された情報のない「完全情報」、サイコロなどの乱数要素がない「確定」、勝敗など結果の優劣が等価値の「ゼロ和」なゲームは、コンピュータによる解析との相性がよい。また、リバーシ(オセロ)や囲碁のように、ルール上ゲームが進行すれば必ず終了する「有限」なゲームでは必勝法が存在し、完全解析することができれば「先手必勝、引き分け、後手必勝」のいずれかに収束する。
◆囲碁以外のゲームAIの歴史
『チェス』
67年に最初のコンピュータチェスが登場し、97年には「Deep Blue」が世界チャンピオンのカスパロフ氏を2勝1敗3分けで破った。
『チェッカー』
50年代に遺伝的アルゴリズムによる解析がなされ、92年に探索型アルゴリズム「Chinook」が42年間で5敗しかしていないチャンピオンのティンズレー氏を破った。07年には完全解が発見され、双方が最適の手を打つと引き分けになることが判明している。
『リバーシ』
75年にチェスの探索手法を用いたプログラムが発表され、90年代には自動的に静的評価関数を学習方法が登場。97年に自動定石学習、パターン学習を搭載した「logistello」が世界チャンピオンの村上氏に6戦全勝した。
『将棋』
79年に2ヶ月掛けてプログラム同士の対戦が行われ、80年代には市販プログラムが次々と発表された。90年より選手権が開かれるようになり、アマチュア有段者レベルの強さが実現、2000年代に入って、実現確率探索の「激指」、全幅検索・評価関数自動学習の「Bonanza」が登場。「棚瀬将棋」「AI将棋」などアマチュア高段者からプロ棋士レベルへと進化している。
◆囲碁のルール
ここで囲碁の基本的なルールを紹介する。
・盤面に黒白交互に石を置いていく。
・19×19の盤が一般的だが、小路盤と呼ばれる13×13(13路盤)、9×9(9路盤)などのものもある。
黒が▲に打てば、囲まれた白の石は取れる
・四方を囲まれた場所に石を置くことはできない。ただし、そこに置くことによって相手の石を取ることが可能で、それによって置いた石が四方を囲まれた状態ではなくなる場合は構わない。⇒『着手禁止点』と例外
Aに白石があると黒に取られてしまうため、Aに打つことはできない。Bも同様だが、Bに打つことによって下2つの黒石を取ることができ、黒石を取るとBの白石は囲まれた状態を脱する
・ある石を置くことにより一手前と同じ状態に戻る場合、そこに置いてはいけない。⇒『同型反復禁止』
この形になると、▲の石を黒が取ったり、再び同じ場所に白石を置くことで簡単に同型反復状態となる
・着手禁止点のことを「眼」と言う。眼が2つ以上ある石の繋がり「連」は絶対に取られることがない。これを「生き」ている、と言う。
極端な例、黒石の連を取ることはできない
・囲碁では先手の黒が有利であることが周知であり、それを是正するために黒にハンデを負わせる。これを「コミ」と言い、6.5目あるいは7.5目が一般的。
◆囲碁AIの難しさ
チェスや将棋のAIの強さと比較すると、囲碁のAIは問題にならないくらいに弱かった。その原因は次の2つ。
・探索空間が大きい
ルールに従って着手できる点(合法手)の数を、終局までの手数だけ掛けると探索空間が概算できる。これをゲーム別に比べると、
チェッカー 10の20~30乗
リバーシ 10の28~60乗
チェス 10の50~120乗
将棋 10の71~220乗
囲碁 10の171~360乗
と囲碁が他を圧倒している。それだけ最適手を求めるのに時間が掛かるため、同じスペックのコンピュータでは相対的に弱いものしかできない。
・評価関数が作りにくい
囲碁は全体を広く見渡す大局観が必要となり、局面ごとの最適手が勝利に必ずしも結び付かない場合がある。そのため、その場の状況だけで判断する静的評価関数を作ることが困難。
つまり、ある局面における良い手が多く存在し、正確に最適手を選ぶことができないのだ。
◆囲碁の評価関数
評価関数を考えるにあたり、囲碁と将棋の違いは次のようになる。
| 囲碁 | 将棋 | |
| 盤面 | 19×19 | 9×9 |
| 駒・石 | 白石・黒石 機能差なし |
8種類の駒 機能差あり |
| 合法手 | 361手から減少 | 平均80手程度 |
| 終了手数 | 200手程度 | 100手程度 |
| 評価関数 | 石の繋がり 地 石の強さ |
駒の損得 駒の効率 王の危険度 |
将棋と比べて囲碁の評価関数を難しくしているのは、
・将棋の駒は種類ごとに機能と優劣に差があるが、囲碁の石にはそれがない。
・リバーシにおける角のように、明らかな特徴を持った場所が少ない。
・支配領域の広さを基準としても、領域が確定するのはゲーム終了時になる。
・局所的な最善手が全体の最善手ではなく、相手に取らせるためにわざと置く「捨石」というテクニックが常套となっている。
などの点で、さらに上級者の間でしか理解できないような評価基準が存在する。
・石の厚い薄い
石の厚みは物理的厚さではなく、ある石の配置が全局的に与える影響のこと。
・形の良し悪し
複数の石の配置の評価。良い形になるように、悪い形にならないように注意することにより、「打ち筋が良くなる」効果がある。ただし「愚形の妙手」も多数存在する。
「代表的な悪い形」
┼┼┼┼┼┼
┼┼●┼┼┼
┼┼●●┼┼ アキ三角
┼┼┼┼┼┼
┼┼●┼┼┼
┼●●●┼┼ 陣笠
┼┼┼┼┼┼
「代表的な良い形」
┼┼┼┼┼┼
┼●●┼┼┼
┼○○●┼┼ 二目の頭
┼┼┼┼┼┼
┼●●●┼┼
┼○○┼┼┼
┼┼┼●○┼ ケイマにツケコシ
┼┼┼┼┼┼
・味の良し悪し
後々の状況変化による可能性を「味」と言う。棋力が高くなるほど、必要のないを打たずに可能性を残すようになる。
・地への甘辛
地の確定具合を表現する言葉が「甘さ」。ある領域を確定させるような手は「辛い」ということになる。
・石の重い軽い
重い石とは逃げたりサバいたりする必要がある石。対処になければならない重要度をさす。
これらの定量的評価は、現状ではたいへん難しい。
また、評価関数は速く正確な必要があるが、今のところ囲碁の評価関数は遅いか不正確、あるいはその両方となっている。
◆囲碁AIの歴史
そんなコンピュータ囲碁の歴史は、60年代に始まる。62年にコンピュータ囲碁関連初の論文となる、「囲碁の好手、悪手に関する研究」が発表され、64年には3x3程度までの小路盤の解析が完了した。
68年に初の囲碁プログラム「Zobrist」が登場、38級程度の強さであった。
70年代に入って、置かれた石の周辺に発生する影響力を関数として扱う手法。石の生死を判定するアルゴリズムなど生まれ、79年にReitmanとWilcoxによって、攻撃と防御の基本的戦略と、連と群の階層パターンを持ったプログラムが作られ、15級程度の強さを見せた。
80年代に入って、囲碁の複雑さに関する研究が進んだ結果、囲碁の難しさが数学的に証明される一方、84年にロンドンで開かれた13路盤のコンピュータ囲碁大会が開かれた。続く86年に台北で19路盤の大会が開始され(2000年まで開催された)、「Many Faces of Go」「Go Intellect」「Goliath」など、ある程度の強さを持ったプログラムが出現した。この時期に商用プログラムの発売も始まっている。
大会が定期開催されるようになったことから、90年代は新たなAI技術や認知科学(機械学習、ニューラルネットワーク、組み合わせゲーム理論など)によって囲碁AIは進化し、95年に5級、97年に3級の認定を受けている。
2000年代に入ると、コンピュータによる7路盤までの解析が完了。01年には初段の認定も受けている。
一方モンテカルロ法は、93年に初めて組み込まれたAIが登場しているが、当時はパッとした成績を残してはいない。これがPCの性能が向上した06年、モンテカルロ法を改良したアルゴリズムである「モンテカルロ木探索」を実装した「CrazyStone」が、CO2006(Computer Olympiad 2006)世界大会の9路盤部門で優勝。この方法は続く07年のCO2007の19路盤部門でも猛威を振るい、同年のUEC杯では優勝の「CrazyStone」をはじめ、上位4プログラム中3つがモンテカルロ法(木探索)を用いていた。
08年はコンピュータ囲碁にとって革命の年となった。3月のパリ囲碁トーナメントのエキシビジョンで、「MoGo」というソフトがプロ棋士カタリン五段と対戦。19路盤では9子のハンデをもらったものの敗れたが、ハンデなしの9路盤では3局対戦したうちの1局に勝利するという快挙を挙げた。
これ以降の躍進は驚異的で、8月のUS Go Congressにおいて、9子のハンデをもらったものの、MoGoが韓国のプロ棋士金明完八段に勝利。9月のFIT2008では、8子のハンデで「Crazy Stone」が日本の女流棋士青葉かおり四段を破った。
モンテカルロ木探索実装ソフトは、CO2008でも優勝した「Many Faces of Go」を筆頭に、全13プログラム中上位9位までを独占。それまでのインテリジェントな手法を「強さ」だけで駆逐してしまった。
◆従来方式の囲碁AI
モンテカルロ法を搭載していない囲碁AIは、基本的に人間が考えていることを模倣している。
まずは「盤面の認識、局面の判断」を行う。石の連結、眼の存在、確定している地などから、着手点を評価。この際、群の強さや石の影響力、安全度なども考慮する。
次に「候補手を生成」する。特徴的な形になった場合の定石や死活、ヨセをパターンから判断して知識データベースと照らし合わせる。また相手の石を取る可能性についても考慮して、状況に見合った深さまでの探索を行い、有利な手を見つけ評価値を出す。
そして「着手を決定」する。候補手の中から、着手の目的別に各々の評価値を比較して、次の1手を打つ。ここでは複数の評価値の依存関係も考慮しなければならない。
探索の方法として一般的なのは、「mini-max探索」と呼ばれているもので、自らの手はできるだけ高い評価に、そこから想定される相手の候補手はできるだけ低い評価になるように探索していく。その結果を理想的な順番に並べ、可能性の低い選択肢を切り捨てる「αβ枝刈り」を行うことで、探索を効率化させることもできる。
◆モンテカルロ法とは
乱数を用いてシミュレートを行う統計的な方法。
囲碁は終盤に近づくに連れて合法手が減少し、合法手の中からランダムに選んで打つだけでも必ず終局となる。このような方法でゲームをお終いまでプレイすることを「プレイアウト」と言う。
囲碁の評価関数は難しいが、プレイアウトした結果だけを見て、どちらが勝ったかを判断することは非常に簡単。そこで、「自分の眼には打たない」「2つ眼を持つ石は取られない」など、合法手の中から囲碁の基本的禁忌を排除してプレイアウトを行い、その結果から勝てそうな手を選ぶモンテカルロ法は実装が容易である。
この方式を用いた局面評価は、たくさんのプレイアウトを行った結果だけを利用するが、目数の差の平均ではなく、単に勝率だけを使う方が強くなる。ちなみに勝率評価方式対目数差評価方式で模擬戦を行うと、8割以上勝率評価が勝つ。これは、囲碁においては大勝することの意味があまりないことによる。
しかし最善手を返す保証がないため、
・相手に正しく応じられると損をする手を打ちやすい
・相手のミスを待つ手を打ちやすい
・正解の手が少ない局面では間違える確率が高い
などの欠点があり、これだけでは従来の囲碁AIに対してもほとんど勝つことができなかった。
◆木探索への改良
このモンテカルロ法でのプレイアウトの方法を改良し、有利な手に多くのプレイアウトを割り当て、プレイアウトの回数が閾値を超えたら、木が成長するように一段深い階層まで検索するアルゴリズム「モンテカルロ木探索」を持った「CrazyStone」の登場は、コンピュータ囲碁界だけでなく、ゲームAI研究に革命を起こしたと言える。
その理論的背景は「Multi-Armed Bandit」という、統計学や機械学習の分野で研究されてきた問題の解決である。Multi-Armed Bandit問題とは、複数のスロットマシンがある状況で、与えられたコインを使ってできるだけ多くの報酬を得るための戦略を考えるようなもの。この最善の戦略は85年に見つけられているが、計算量、メモリ消費ともに大きいため実用にはならない。そのため、計算量が少なくて優秀な戦略が必要となる。
これに単純なモンテカルロ法を当てはめると、「全部に同じ枚数を投入して平均結果を比べる」だが、これでは優秀な戦略とは言い難い。
ここで登場するのが「Upper Confidence Bound(UCB)/信頼上限」という考え方。これは確率的に結果が悪かった場合、試した回数が多いほど本当にダメなので見捨て、逆に少ない場合は運悪くダメだったのかも知れないので見捨てないでプレイアウトを続ける。
具体的な式は下のようになるが、UCB値が高い手からプレイアウトするように選ぶと、浅い読みで良さそうな手を優先的に深く読む「最良優先探索」のようになる。
このUCBを木探索に応用したものを「UCT(UCB applied Trees)」と呼び、UCB値の高い候補により多くのプレイアウトを割り振り、末端でのプレイアウト回数が閾値を超えたら、その手を展開する。これを行うことにより、探索回数が大きくなるに従って、結果が期待値そのものに収束することが証明されている。
このUCTを最初に取り入れた囲碁AIが、平手9路盤で初めてプロ棋士から勝ち星をあげたMoGoになる。
◆木探索自体の効率化
現在の囲碁AIの主流は、この木探索をいかに効率化するか、という部分に知恵が絞られている。
「Progressive Widening」
囲碁の知識を用い、良さそうな手から候補手をソートして探索木を効率化する。この手法を取り入れることにより、より「囲碁っぽい」手を打たせることができる。
人間の棋譜から統計を取って学習し、着手確率の高いところを重点的に探索する。山下氏による実装例では、3×3のパターンを利用して着手点の周りの状況を判断している。これは
・対称性の無視
・盤端の判断
・着手点の周り8マスに直前に石が置かれたか
・白黒用を別に持つ
を考えて、295万のパターンをプロ棋譜1万局から収集し保持している。
高確率のパターンの例
低確率のパターンの例
このパターンを利用して
・全ての手に確率をつける
・取られそうな石を防ぐ手の確率を上げる
・相手の石が取れる手の確率を上げる
・数手で相手の石が取れるパターン(シチョウ)がある場合、確率を上げる
などの工夫をしてプレイアウトを行っている。
「AMAF(All Move As First)」
囲碁のプレイアウトの場合、最終形で打たれている石は、どの順番で打ったとしても結果が同じになると考え、全ての手が1手目に打たれたことにして、擬似的にプレイアウトの回数を稼ぐ方法。乱暴な方法だが、9路盤の場合なら1回のプレイアウトで50手くらいが更新できるため、評価速度は50倍になったと換算できる。
実装する場合には、各手ごとに「通常のUCBの値」と「AMAFでの値」を持ち、探索回数が少ないうちは、AMAFの評価を重視するように、両方をミックスして候補手を選ぶ。
「Rave(Rapid Action Value Estimate)」もAMAFと同じ意味に使われている。
「候補手の絞り込み」
囲碁は合法手の数が多いため、モッテンカルロ法を使ったAIでは手をしぼらないと強くできない。そこで
・パターン参照
・盤端からの距離
・直前の相手の手からの距離
・2手前の自分の手との距離
・連の死活探索の結果
などを考慮した上位手からのみ探索を行うことで、強くすることも可能。
「メモリの節約」
探索の基本は、まだ一度も探索したことのない局面で1回プレイアウトを行い、既に1回でもプレイアウトを行った局面では、そこで可能な手を選んでプレイアウトを行う。しかし、この方法だと膨大なメモリが必要となるため効率が悪い。
そこで、ある手に関して一定量のプレイアウトを繰り返し、その後に別の局面に移ってメモリを節約する方法もある(CrazyStoneに実装)。
これらの方法で探索を効率化することにより、速度が数分の1に高速化されているにも関わらず、棋力は大幅に向上しているのが囲碁AIの現状だ。
◆囲碁におけるモンテカルロ法の利点と弱点
モンテカルロ法はなぜ囲碁AIに有効なのか?
最大の理由は、将棋やチェスなどと違い、プレイアウトで普通に終局するゲームであることだ。これはリバーシにも言えることだが、リバーシは評価関数が組みやすく、探索空間も狭いため、モンテカルロ法を利用するまでもなく充分に強いAIがある。
また、他のゲームと比較すると、最善手と次善手の価値の差が一般的に小さい。そのため確率論的な解法と馴染みやすい。手順に関係なくある位置を占めておく「布石」などで有利な状況が作れるというのも、乱雑さを逆に活かせることになる。
逆に囲碁に用いる上での弱点も多い。最大の弱点は、隅の死活や攻め合いなど、手順が強制されるケース。勝てる手順が一本だけで、他は全部負けるような場合は正解にたどり着かない。
「シチョウ(逃げても取れる形)」
「ナカデ(2眼を作らせない目的で相手の陣地の中に打ち込む)」
「セキ(お互いに相手の石を取ろうとすると自分の石が取られてしまうので手を出せない状態)」
などのありがちな手を考慮したり、死活の判断をプレイアウトに組み込んだりすることで、この弱点を緩和することはできる。現在は「ありがちではない一本道」の克服が課題になっている。
このような現状での最大の利点は、プレイアウト回数を増やすことにより棋力が顕著に向上すること。これには並列化が効果的で、「コア数が4倍になればハンデが1子減る」と言われ、MoGoが256コアのクラスタを用いていたのに対し、最近の探索方法の進化を考えると、1000コア以上のクラスタを使えば、プロとの対戦も実現できるのではないかと思われる。
ちなみに山下氏の検証例として、将棋プログラム「YSS」と囲碁プログラム「彩」を使い、共に2倍の思考時間を使ったところ、ほぼ同じくらい棋力が上昇した。これを並列化で比較してみると、2コアで約1.4倍、4コアで約2.0倍、8コアだと約2.6倍、囲碁のプログラムが将棋の速度上昇を上回る。
ひょっとすると、このペースで進むなら、将棋AIよりも先に囲碁AIの方が名人に勝ってしまうかも知れない。
モンテカルロ木探索では評価に勝率を使うのだが、勝率を最大にしようとするAIと対戦すると、勝つときはおもしろいのだが、負けるときはつまらないという傾向がある。このAIは、勝っている場合は確実で無難な手を打つ。対戦している方から見ると、これは「手を抜かれている」「弄ばれている」ように感じられる。負けている場合は、ジリ貧で負けることを避けるように働くので、逆転を狙って無理な手を打ってくる。これを返り討ちにして圧勝するのは、対戦していて楽しい。
負ける時につまらないという問題は、AIの強さを多少犠牲にすることで解決できる。このAIは、プレイアウト回数が少ない場合でもそれなりの答を返す。また、回数を減らすと「自然な弱さ」になる、一本道手順を考慮しないと「うっかりミスをしてるように見える」など、エンターテインメント性も高い。もちろん制限時間のある競技などでも、時間切れで着手の解析ができないことがなく、持ち時間に応じた強さを発揮する。
◆他のゲームへのモンテカルロ木探索の応用
将棋のように終局が確定していないゲームは難しいが、終局が確定しているゲームへの応用は充分な成果を既に上げている。
「さめがめ(SameGame)」
問題集を解かせてスコアを競う。モンテカルロ木探索ベースのプログラムが記録を更新。
「ハーツ(Hearts)」
モンテカルロ木探索を用いたプログラムが、既存のプログラム以上の強さを示す研究がある。
「General Game Player Competition」という汎用ゲームプレイヤー大会がある。これは大会の場で架空のゲームルールが提示され、その場でプログラムがルールを分析し、直後に対戦するというもので、1人ゲーム、2人ゲーム、多人数ゲームなどがごちゃまぜになっている。総合点が高い方が勝ちというこの大会で、UCTをベースとした「CADIA Player」が2年連続で優勝している。
このようにモンテカルロ木探索は応用性が高く、麻雀のような不完全情報で不確定なゲームであっても、終局が確定しているので組み込みは可能だと思われる。また、プレイアウトに評価関数と組み合わせるなどの工夫をすれば、必ず終局しないゲームでも効果が見込まれる。もちろん、ゲーム以外の分野であっても、戦略が木構造で表すことができて、プレイアウトが可能なら、モンテカルロ木探索を用いることができるのは言うまでもない。
--------------------------------------------------
遠藤は囲碁のルールを知っている程度なので、今回の講座はものすごく敷居が高かった。完全に理解できていない可能性もあるので、このレポートには間違いがあるかも知れない。
技術の進歩がコンセプト自体を変えてしまうというのは、コンピュータの歴史の中では珍しくない。いわゆる「パラダイムシフト」なわけだが、AIの世界では「いかに人間の考え方を体系化して、その上を目指すか」だったのが、コンピュータのスピードの進化が「数百万人のバカに試しにやらせてみて1人の名人を倒す」を可能にしたのだろう。
伊藤先生の言葉の中に、
「囲碁AI研究者の中では、モンテカルロ法を取り入れることを『暗黒面に堕ちる』と揶揄する場合もある(笑)」
というのがあったが、遠藤にしてみれば「コンピュータAIに必勝法を解析させる」ことが、そもそも暗黒面だと思うので、逆にクローン軍団を手に入れたと思えた。
今までの囲碁AIでは読み切れていなかった部分を、モンテカルロ法という検証システムを使って確率論的に読み切れるようになったと考えると、モンテカルロ法の実装は従来の囲碁AIに座布団を敷いただけだった、というのが後世の評価になるのではないか?
講演終了後に講師の御三方に「いずれ囲碁が解析完了してしまったら?」という話を振ってみた。既に解析され、引き分けが確定しているチェッカーもプレイに対する興味が失われていないくらいだから、ゲームとしての囲碁は解析されたとしても面白さは何も変わらないとのことだった。むしろ、時代によって変動する「コミ(先手有利を是正するハンデ)」を確定できるメリットがある。優秀なAIに相手をしてもらえれば、自分の棋力が上がるし、囲碁人口が増えるキッカケにもなると前向きだった。
山下氏の「彩 」はフリーソフトとして公開されているので、皆さんもこれを機会に囲碁を楽しんでみてはいかがだろうか?
DVD分析127「アーメイvsドルアーガ」
アーメイはジルの中に何かを感じて、自分の何かを託して生き切った印象を持っている。
作画が大変綺麗になっているキリッとした顔のアーメイ。勝手な妄想だけど、アーメイって兄弟が居なかったんじゃないかな。だからオーウェンに対してもしどろもどろだったし、ジルと一緒にいるうちに弟分のように感じたのだと思う。
アーメイがドルアーガに登ろうとしているところ。スターウォーズ帝国の逆襲で、スノーウォーカーにルークが登って行くところと遠藤は被った。だいたい、こいつの上に登ったからといって、倒せるかどうかわからないのだが、確信持ってそうな行動なのが不思議。
ドルアーガの後頭部に甲殻の亀裂を発見、ニーバが撃った虚無の矢が開けたものなのか、最初からここに隙間があったのか?ニーバが後頭部を狙ったのが、最初から確信あってのものならば、この隙間はギルの剣が貫いた痕なのではないかな。
人間の顔をしているので脊椎動物と見えるが、どう見てもこいつは外骨格風。脊髄部分が急所になっているとは思えない。メインの神経経路は左右対称であるとして、ここより光っている額の眉間部分の方が直撃になりそうだ。
先端の刃を回転させようと、スターターに手を掛ける。ここで引けたとしたら、次のシーンは妨害され、アーメイこそが英雄になっていたに違いないのだが・・・。
これは尾の先端だろうと思うのだが、刺針が現れる。毒持っていそうだよ。
で刺さったところなのだが、テーパ部分の角度が上の画像とだいぶ違う。上の針のようなものであれば、刺さって抜けてもしばらく生きながらえそうだけど、刺さっているこの角度だと、かなり強引に体内に食い込んでいるので、抜いたときに上半身と下半身はほとんど繋がっていない。
で、次のシーンではやっぱり細い針になっている。ドルアーガの針部分は興奮すると太くなるのかも知れないと考えたら、キモさ倍増してしまったよ。
アーメイの落下シーンは、常套手段だがジルの瞳に映った形で表現される。結構な高さを頭から落下しているので、それだけでも致命傷になりそう。「ここまでしかできない」とカーヤは言っているが、この状態のアーメイを生かしているというのは、それだけでも優秀なオラクルであることは揺るがない。
- ミクロマン ミクロアクションシリーズ クイーン エイリアン MA-14
- ¥5,000
- Amazon.co.jp
人気エントリー目次
◆ 新着 ◆
【DiGRA公開講座】モンテカルロ木探索とは何か?
08/12/14 ![]()
【P-01A】文字の縦横はどうやって変わるの?
08/11/20 ![]()
◆ ゲーム学術系 ◆
【ゲーム制作の現場】企画を簡単に生み出す方法 08/7/2
【CEROレーティング】ゲームのレーティングに関する報告 08/9/1
【CEDEC2008】私的レポート 08/9/12
【DiGRA JAPAN 公開講座】同人ゲームの過去・現在・未来 08/10/1
【DiGRA JAPAN 公開講座】10/31「ひぐらしのなく頃に」レポート 08/11/10
【DiGRA公開講座】モンテカルロ木探索とは何か?
08/12/14 ![]()
◆ ゼビウス関連 ◆
【ゼビウス】ゼビウス軍兵器開発史メモ(1982)
08/8/12![]()
【ゼビウス】バキュラは256発当てると破壊できる? 08/6/13
ミル・フラッタ・クルトのカラーリングはどうなっているの?
08/8/5![]()
◆ トピック系 ◆
【三宅チャンと会食】数年来の夢が叶った話
08/10/23
【ワンダーフェスティバル2008】1/144ソルバルゥ・サイン会
08/8/4
【東京ゲームショー2008】遠藤的リポート
08/10/10
【副都心線】渋谷駅 08/7/10
アニメ「ドルアーガの塔」打ち上げ 08/7/7
【ドルアーガの塔】DVD発売記念イベント 08/7/14
【P-01A】文字の縦横はどうやって変わるの?
08/11/20 ![]()
韓国Yellow社との協業と、ペ・ヨンジュン氏のキャラクター「ジュンベア」使用 08/7/31
【ミステリーUFO】賭けに勝ったよ(笑) 08/8/29
DVD分析126「パズズのドルアーガ戦」
天空の宮に入った人間たちの中で、パズズが出し抜かれる可能性を感じていたのはニーバだけのようだ。
というわけで、全力でニーバを排除しようとする。再び対峙した二人だが、この時点で御者と呼ばれていた一人がニーバによって射殺されている。
にも関わらず、爆発物を用いた自爆攻撃を仕掛けさせる。この御者という存在は、パズズによって支配されてしまっているのだろう、特にコミュニケーションを取っている様子もなく、絶妙のタイミングでニーバに仕掛ける。
それにより、パズズは4人いた御者のうち3人を失って、残りはカブタとい名前の頭目風の1人だけになる。以前のエントリーで、この背の高いマスクの方をカブタ族と書いていたが、これは設定を見て書いたつもりが、第11話の台本を見ると、御者のリーダーがカブタで、マスクの人足はグダナ族になっていた。ちゃんと確認しなくてゴメン。
この4体?については、御者1人でコントロールできるのだろう。既に柩をここまで持ってきたので、パズズのことだからどうせ口を封じるつもりだったのかも知れない。
安元君のDVDコメンタリーで紹介されていた、呪文の中で「ソル・バルゥ」って言ってる場所がある、というのはこのシーン。詠唱する呪文については、賀東さんも結構苦労されていたらしいけど、2期で新たなキャラクターが出てきて、どんな呪文になるのかは、ちょっと興味がある。
いよいよパズズが決戦兵器の封印を解く。
「かの者は赤、かの者は黒、かの者は鏡にして、精強なる闇の者」このセリフが3人分のことなのか4人分のことなのかは分からないが、「者」が4回出てきているので、4人分の指示だと思いたい。とすると、
赤=レッドナイト
黒=ブラックナイト
鏡=ミラーナイト
とここまでは問題ないけど次の「闇」は何を意味するのだろう?
ブラックナイトが既に出ているので、それ以外の闇・・・となると、最有力はマーダック王を殺したハイパーナイトのウガ(アガ)。あるいは80年前にギルたちからロッドを奪おうとしたアキンドナイト。ではないだろうか?
表1話に登場したドルアーガ参人衆ではないのは確実。でも、ドルアーガが部下として使っていたナイトたちで、ドルアーガに対抗することができるとはとても思えない・・・パズズ自信あり過ぎ?
柩が開き始めたところ、DVDが出たら絶対やってみようと思っていたのが、この黒くてよく見えない部分の画像処理。というわけで、結果がこちら。
これはモノアイといい色といい形といい、完全にレッドナイトに見える。第12話で出てきた4人組はロボットみたいなのを除いて全員人間風だったので、この時点では中身が異なっている。これをどう見るのかは解釈が分かれるところ。
本来は人だったものが、柩の力によってこの形にされていたのか・・・穿った大人の事情的見方だと、1期で終わる場合はこのまま登場した予定だったけど、2期に続くことになったので中身が入れ替わったのか(笑)
でもこのレッドナイトがカッコよく動くところも見たかった気がする。
放送時には本当に気付かなかったけど、コメンタリーで千明監督の話を聞いて確認したのがここ。ニーバの矢は矢羽もなくて、特にこれは単なる急こしらえの矢かと思っていたのだけど、まさか矢尻に使われていたのがカリーの形見だったとはね。ニーバを見直した部分でもあるのだが、誰も気づかないぞ!
ドルアーガの攻撃によって、パズズ部隊は「柩も含めて」全滅する。吹き飛ばされた柩の中身が、この効果で変わった可能性も考えられるし、ドルアーガが中身に気付いて何か仕掛けたのかも知れない。
P.S.最近、このシリーズを携帯電話で見ている人がPCで見ている人を超えたみたいなので、改行を減らしてみたいのだが・・・
- ドカーン~★ 自爆装置付!? 目覚まし時計 アラームロック
- ¥1,580
- マーキュリーストアー
DVD分析125「サキュバスのバスルーム」
第11話の入浴は、最も露出度が高いサキュバス。まぁ、もともとエロ系の神様なわけなので、全裸もデフォなんだけど(笑)
ニーバにチャチャを入れていたら、周りに分かるようにハッキリ怒られてしまう。このサキュバスの存在が公然ではないのは、ニーバが隠しているのか、サキュバスとの間に密約があるのか?
カイの場合はジルはカイのことをパーティーメンバーに伝えているものの、メンバーには見えないので特に触れてはいないと見れる。ニーバは明らかに隠蔽しているのだが、自分一人で独占したい何かがあるのか、それともサキュバス憑きの人間であることが、マイナス評価に繋がるのか?
最も、こんなエロい姉ちゃんが付いてるとなると、ファティナは同行しないとは思うのだが(笑)
ニーバに怒られてサキュバスが自分の家?に戻る。回りの景色から天空の宮内にある風だが、水がこのような状態で存在するのは、無重力だからに違いない。水が上に流れていたところの不自然さに比べたら、無重力地帯など現実の延長線上にある。
水の球ができているが、ここにサキュバスが入る。この水の温度については推測しようもないが、風呂というより単にイージーチェアとしての役割しかないのかも知れない。
で、大画面モニターでドルアーガ戦を観戦する。天空の宮に入る時に使っていた祭壇とは趣きが全く異なり、こちらはリビングルームなのだろう。もう一人のカイの方はどこに居るんだろうね?少なくともここまでくつろいではいない、ジルの前にいつでも出れるように服は着てるだろうしね。
観戦していても、一応人間たちを応援している。ドルアーガは元カノという位置なのだが、このドルアーガはその形を真似ただけの存在なので、多分彼女の本命はニーバ。そのニーバを自分に釣り合う男にするために、幻の塔へ登らせようとしているのなら、こんなドルアーガはさっさと片付けて先に進みたいはず。
それ以前に見ているだけで退屈なのかも知れないが・・・。
- ナショナル マッサージチェア リアルプロ EP3530-C(アイボリー)
- ¥458,000
- ケンコーコム













































