第1回：建築のジオメトリを拡張する

モデレータ：堀川淳一郎（Orange Jellies）
三宅陽一郎（日本デジタルゲーム学会理事）＋菊池司（東京工科大学メディア学部教授）

2. 業界の制限

堀川──ありがとうございます。とてもいいヒントを頂いたと思います。次に、業界特有の制限について質問したいと思います。建築の分野では、重力の影響を受ける状況で形をつくるという制限によって、ジオメトリの技術が発展しました。そこで、各業界で使われているジオメトリに関する技術とアプローチ、その背景にある業界特有の制限を教えてください。

シミュレーションのリアルさを評価する方法

菊池──エンタメのためのCGには、制限はありません。しかし「どのようにリアルさを評価するのか」ということが問われます。学術研究である以上は評価が重要です。プロシージャルアニメーションの研究は、物理現象の物理式を厳密に解くような研究分野ではないので、経験や記憶に則って視覚的な特徴を抽出し、アニメーションを生成します。発表時に成果映像と、参考の実写映像を並べて示し、見た人がリアルかどうかを判断することが、究極の評価方法だと考えています☆26。

☆26──［木内］「見る」という行為の本質を突いており、一周して非常に面白い。物理的には異なる論理で記述されたものを同じだと思えてしまう人間の視覚。僕らは何を見ているのか、見てしまっているのか。では音では？触感では？逆に言えば、人間は異なるものと関係を結んで誤読してしまう能力を持っているということ。それは媒介となるものを明らかにすることでもあり、とてもクリエイティブな潜在性をもった研究。

ひとつ例をご紹介します。アマミホシゾラフグという不思議な生態のフグがいるのですが、このフグは砂を巻き上げて、ミステリーサークルのような模様を海底につくります。この新種のフグが発見されたというニュース映像を見ていて、先ほどの雲や雪崩の研究を応用して、シミュレーションができるのではないかと思いました。

そこで、粒径の異なる3種類の砂による水中での舞い上がり方を、実験と観察にもとづいてシミュレーションしました。まず、研究室に水槽と3種類の砂を用意して、水を入れたペットボトルで水槽の底の砂を叩き、どう舞い上がるのかを実験します。その様子を撮影した映像を見ながら、トライアンドエラーを繰り返してパラメータを探すのです［fig.2.1］。

: fig.2.1──水槽での細砂の舞い上がり方の実験（中）とそのシミュレーション（右）［掲載用に解像度とフレームレートを落としてGIFに変換］

最終的に、それぞれ3種類の砂のシミュレーションを組み合わせるという手法をとりました［fig.2.2］。本来は、それぞれの相互干渉を計算する必要がありますが、面倒なので端折りました。海底で砂が巻き上がる様子は、参照する映像がなかなか見つからないので、実験した映像をリアルさの説得材料として用いています。こうしたリアルさの検証という点が、CG研究業界の制限だと言えると思います☆27。

☆27──［角田］デジタルの分野では、実験や観察といったことはおろそかになりがち。フィジカルな空間で起こっていることをデジタルな視点で観察して、それがいかにしてコンピュータにインプット可能なものになるのか。これを観察することも重要な視点だと思う。

: fig.2.2──3種類の砂のシミュレーションを組み合わせたコンポジット映像［掲載用に解像度とフレームレートを落としてGIFに変換］

堀川──シミュレーションの過程が面白いと思ったのですが、学会では過程自体は評価はされるのでしょうか。

菊池──学会では、アルゴリズムなどの過程が評価対象になります。最終的にレンダリングしていなくても、ドットでパーティクルがどういった動きをしているのかを示せればいい。最終的な成果としての映像より過程のほうが重要です。

堀川──3種類の砂のシミュレーションを最後に合成する際、どういった計算をしているのでしょうか。

菊池──モーションのデータがそれぞれ3種類あり、このパーティクルにはこのボリュームを与えるというように、ただ加算しているだけです。

堀川──加算するだけで、立体としてはリアルに見えてくるのですね。

菊池──そうですね。1種類だけではディテールがなくなってしまうので、3種類を別々にシミュレーションして、最終的にコンポジット（合成）すると、ディテールが増えることになります。

地形に沿ったキャラクターの思考

三宅──ゲームAIには「リアルタイム」「インタラクティブ」「ボディ」という強い制限があります☆28。ゲームの状況は刻一刻と変化するので、時間をかけて地形を解析することはできないのです。そこで生まれた技術が「戦術位置検索システム」で［fig.2.3］、ゲーム内の地形をリアルタイムに把握して、キャラクターの能力に合わせて立つべき位置を発見するシステムです。と言っても、単純な技術で、まずポイントをとりあえず地形上にばら撒いて、条件を指定して各ポイント（例えば足場の悪い場所や敵の近くなど）を評価して、目的に合わないポイントを削除していくというプロセスです。

☆28──［池田］3つの概念はすべて「人間」との直接的関係について指摘している。すなわち高度に数理的なシステムとしての「ゲーム」が「人間」（とその「楽しみ」）をシステムの中心に持っていなければならないことを示している。

: fig.2.3──戦術位置検索システム

これによって、AIが目的地を決めることができます（クエリーシステム＝問い合わせシステム）。以前は計算の処理速度などの制限によって、ゲームデザイナーが最初から数点を指定して、そのなかで一番いいポイントを見つけるという固定的な考え方でした。ところが、人工知能が動的にポイントを評価して、ダイナミックに自分自身の行くべき場所を見つけることができるようになりました☆29。

☆29──［豊田］建築の計画や企画から、竣工後の効率的・動的な利用の局面においても、こうした考え方がもっと参照されたり、ゲーム技術が応用されるべき。建築の場合で面白いのは、同じ技術であっても、異なる応用の時間スケールに異なる目的で援用できる可能性がたくさんあるということ。そのためには、異なる時間スケールごとのアルゴリズムや適応領域にもっと意識的でないといけない。

もうひとつに「ゴールデンパス」という考え方があります。ダンジョンの中にはプレイヤーが脱出するポイントが決まっていますよね。そこで、ナビゲーションメッシュを使って、プレイヤーが通れる範囲のなかで推測される目標地点への経路を検索したパスを「ゴールデンパス」と言います。つまりプレイヤーが行動する予測経路です。ゴールデンパスに沿って戦術位置検索をすると、味方のAIがプレイヤーを援護して進むような地形認識ができます★2 ☆30。

☆30──［石澤］これまで建築設計で扱いが難しかったもののひとつに、大空間の中での行動設計がある。パスの設計が静的なので、図学的な仕掛けしか検討できず退屈な提案になりがちだった。大空間、かつ間仕切りなど従来型の建築要素に頼らない空間設計のヒントが得られそう。

★2──Matthew Jack, Mika Vehkala Spaces in the Sandbox: Tactical Awareness in Open World Games（GDC2013）

ナビゲーションメッシュ、ゴールデンパス、戦術位置検索、という技術を組み合わせることによって、地形に沿ったキャラクターの思考が可能になります。これによって、2体でも3体でも仲間を配置することができる。じつは、ゲームでは仲間のコントロールが一番難しいんです。プレイヤーが敵を発見する前に仲間が手榴弾を投げて倒してしまったり、味方がちょっとでもミスをするとプレイヤーが怒ったりします。ですから、仲間のAIには精緻な地形解析が求められるのです。

地形解析とディープラーニング

こうした地形解析は、最近はディープラーニングと関連しています。そもそも、人工知能には2つの大きな流れがあります［fig.2.4］。ひとつはシンボルによる人工知能（記号主義）で、IBMワトソンやGoogle検索などがこれにあたります。もうひとつはニューラルネットによる人工知能（コネクショニズム）です。囲碁のプログラムで有名なAlphaGoがこれに該当します。絵を描かせたり、遺伝的アルゴリズムを用いて形状を進化させるニューラルネットもあります。

: fig.2.4──人工知能の2つのタイプ

2015年にDeepMind社のAIが、「スペースインベーダー」や「ブロック崩し」といったAtariのクラシックゲームをプレイし、ハイスコアを出す研究がありました。Atariのゲームは画面がスクロールしないので、入力層にゲーム画面を入力し、経験を重ねて強化学習させることができます。つまり、ニューラルネットはゲーム画面（視覚情報）をそのまま認識して学習することに向いています。

AlphaGoは、そのゲーム画面を碁盤に応用したものです。かつての評価関数の確率分布を出すニューラルネットに置き換えたんですね。端的に言えば、囲碁の盤面を模様のように見立てることで、直感的にパターンを見出しているのが最近のディープラーニングのかたちです。

テジタルゲームは1975年から（定義によってはそれ以前から）ありますが、ゲームAIがなかなか進化しなかったのは、AIは連続空間の把握が難しいからです☆31。人工知能の研究では、連続する空間をいかに離散化して把握するかという試みがずっと行なわれてきたのです。いわば、現実空間をチェス盤に見立てるようなものです。

☆31──［豊田］付け加えると、建築平面の自動生成などの分野へのAIの応用がより難しいのは、建築の設計は部分連続と部分同士の不連続が複雑に絡み合っていることが単純な平面生成でも前提で、特にその部分連続では端部に行くほど評価が高くならないといけないことが多い。その点でこれはディープラーニング系のAIにはおそらく苦手な領域で、そのことがなかなか理解されない。ディープラーニングが得意なのは、ぼんやりとした方向性の提案。初速を与えることと、ハードラインに落とし込むのは、勘所を押さえたデザイナーの仕事になるはず。

先ほどの戦術位置検索は、かつてはゲーム開発中に行なっていたのですが、コンピュータの処理能力が向上したことで、リアルタイムに地形をチェス盤に見立て、評価関数をつけることができるようになりました。囲碁やAtariの研究で使われた人工知能のように、経験を重ねて学習する過程は多くの時間が必要です。しかし、現在では計算パワーの制限を超えて、リアルタイムにゲーム内で使えるようになっています。

人工知能のコネクショニズムとニューラルネット

堀川──ありがとうございます。2種類の人工知能のうち、基本的にリアルタイムベースのゲームで使われているAIは記号主義、つまりルールベースのAIなのでしょうか。

三宅──ルールベースと言うと極端ですが、9割が記号主義型ですね。

堀川──すると、コネクショニズムのAIはどういった場面で使われるんでしょうか。

三宅──記号主義は論理的なものですが、コネクショニズムはロジックにならないものを扱います。例えば、地形や波、密度、数値的な分布のようなものはロジックになりません☆32。

☆32──［木内］ゲームのなかで記号として扱えること／扱えないことを考えるのは、実空間で人が何を意識的／無意識的に捉えているのかを端的に逆照射している。つまり地形、波、密度、数値分布も人に影響を与えるという意味では、デザインの対象になりうる。その把握の仕方や対象との関係の持ち方をAI開発から学ぶことはとても示唆的。

堀川──すると、インフルエンスマップはコネクショニズムですか。

三宅──そうですね。大雑把に言うとコネクショニズムに入ります。特に自己組織化マップはコネクショニズムです。例えば、AIが8体の敵に囲まれて、どの敵を最初にやっつけるかという場面。これをロジックで書くと3回書かなければいけないんですね。敵が増えるごとにロジックが、2の4乗、5乗、6乗......と増えていく。書いてるプログラマーは気持ちいいかもしれませんが、基本的にはデバッグできない。そういうときは、上手い人のプレイをニューラルネットに学習させるんです。するとインプットがいまのAIと敵との相対値で、アウトプットがどれをやっつけるかを学習させて、ニューラルネットを使います。これは「スプリームコマンダー2」（GasPowered Games、2010）というタイトルで採用されています。

堀川──例えば、複数の属性A、属性Bというキャラクターがいたとして、それぞれのキャラクター同士が相互に作用する場合。例えばひとつが敵で、ひとつが追う、追われるものとなったとき、マルチエージェントシステムのように、どんどん追って追われて、という手法の動きをするようなものも記号のなかに入ってくるのでしょうか。

三宅──明確に言葉で記述できることは、記号主義で対応できますが、直感的にしか捉えられない映像や音楽はニューラルネット向きです。地形においても、ここは角張っているからロジックを書き、ここは滑らかな地面だからロジックを書き......、と記号主義で考えていてはあまりに気が遠くなってしまいます。

かつて囲碁のAIは、ある状況に対してロジックをひとつずつ書いていました。ところが、碁盤を模様（画像）として見る発想で、ニューラルネットにインプットした。それがAlphaGoの成功した理由でもあります。囲碁は白と黒の単純なマップだから可能ですが、将棋には複数の動きの種類があり、盤面はそれほど単純ではない。なので将棋はロジックなんですね。そこで、3つの駒の配置から学習しようという発想が「Bonanza」や「ponanza」です。

前のページ次のページ