ギブソン的にアニメを知覚する試み@mossya

前回の記事で紹介したギブソン生態学的視覚論を読んで考えたことをだらだらと書いた。長いので暇なときにでも。

ギブソン生態学的視覚論を授業で輪読してたんだけど、結構面白い。彼はアフォーダンス理論について有名で、今回ここで書こうと思ってるのはその理論の前提になっている視覚についてのところ。例にもれずアニメネタが含まれてしまっている。どうしてもアニメと関連付けてしまう。病気かもしれない。あとギブソンの話は和訳で読んでるからなおさらなんだけど難しくって、変に解釈しちゃってるところとかあるかもしれなくて、あと言葉の使い方も厳密じゃなかったりするから、以下はmossyaの戯言ってことで気軽に読んでほしい。

ギブソンは従来のフィルム映画的な知覚のモデル、つまり環境の写像が網膜に映写されて、それを頭の中の人が解釈するみたいな考え方を否定していて、なぜならそのモデルだと情報量が多すぎて無理がある、と。こういうのを人工知能の分野ではフレーム問題っていうらしいんだけど。そこでギブソンは新しい知覚のモデルとして包摂モデルを考えた。これは入れ子状のモデルで、例えば木の葉は木に包摂され、木は渓谷に包摂され、渓谷は山に包摂される、といったもの。逆に言うと山に渓谷が、渓谷に木が、木に木の葉が、入れ子になっている、と。で、そのような知覚の仕方というのは、デカルト的なxyz的な座標軸に照らし合わせて木の葉の位置や形を特定したり、緑色で、葉脈があって・・・といったマトリックス、いわゆる組織図的な知覚の仕方とも異なる。星座の例も出てた。一つ一つの星を星座というもので包摂して、位置とか明るさとかを知覚している、と。

この包摂モデルっていうのがアニメとかギャルゲの画面構成に近いなと思って。アニメでは、背景があってその上にキャラクターのレイヤーが重ねられて、さらにその上に目や口の表情のレイヤーが重なる。つまり目や口は顔に包摂されて顔は体に包摂されて体は背景に包摂されるっていう。さらにこっち側の環境まで含めれば、映像がテレビなりモニタに包摂さて、さらにそれが置かれる台の上とか机の上に包摂されて、部屋の中に包摂される、みたいなところまで行く。まあアニメじゃなくても現実の人間を見るのもそういうことなんだけど、アニメはその包摂モデルをシンプルな形で表現してるんじゃねっていう。

包摂モデルでは「変化する物」と「変化しない物」(=「不変項」)を分けて考える。単純に動く動かないっていうんじゃなくて、ここでの「変化する」「しない」というのには対象が反射してくる光の形が大きく関係している。ちょっと分かり辛いかもしれないけど、「変化する」っていうのには、例えば観察者自身が動くことによって対象が反射する光の面の形(視角)が変化するというものがある。対象をぐるっと回って見るときのその対象が反射する光の面の見え方の変化の仕方にはフォーマットがある。で、このフォーマットから導き出される形が「変化しない物」(=「不変項」)。・・・例えば長方形の天板をもったテーブルがあるとする。その周りを観察者が動くときの天板の面の見え方(視角)はパースがかかるため長方形ではなく台形に近い形になる、よね。で、その台形のプロポーションも、動き回ることでつぶれたり、引き伸ばされたり、刻々と変化する。このプロポ−ションの変化の仕方というのがその天板のもともとの長方形という形に固有のものであるから、観察者は天板の形を正確に捉えることが出来る。ここで「変化する物」というのが台形にゆがめられて刻々と変化する面であり、「変化しない物」(=不変項)というのが、変化の仕方から逆算的に導き出される長方形という形である。逆に、というか同時に、そのプロポーションの変化というのには観察点の位置、つまり観察者の目から頭、体と包摂された身体の位置についての情報も含んでいるということになる。環境を知覚するということと自己を知覚するということは相補的でコインの裏表のようなものなんだ、というギブソンの発想は個人的には結構キてる。

ここでまたアニメなりギャルゲなりの画面を思い浮かべてほしいんだけど、アニメで一番良く動くのは目あるいは口なんだよね。まあどんなアニメかによるけど。アニメじゃなく、ギャルゲだったら確実にそうだよね。表情のレイヤーが一番良く動く。で、その表情レイヤーを包摂したキャラクターのレイヤーがその次によく動く。それらを包摂した背景はあまり動かない。ギャルゲはよく分からんけどセルアニメっていうの?日本産の多くのアニメはこういう作り方を制作コストを抑えるために導入してきた。
関係ないけど、aviとかmp4とか、動画の圧縮の規格があるよね。ああいうのはアニメ動画の圧縮に特に優れてるってのをどっかで読んだ。動画の圧縮は元の動画のコマとコマのあいだで動いている部分と動いてない部分を区別して、動いてる部分だけ替えるみたいな、詳しくは知らないんだけど、そんな方法をとっているらしい。だから映画なんかで画面の全部が時々刻々と変化するような動画の圧縮には向かないというか効率的にはあまりよくない。一方アニメなんかで画面の上に全く動かない場所が長い間あるっていう動画に対しては、その動かない場所をガッツリ圧縮することが出来るから全体としてのデータは小さくなる。まあ、AVIがアニメのレイヤー構造(包摂モデル)やギブソンが言う意味での変化する物しない物まで解析して圧縮してるというわけじゃないけど、コマとコマを独立で考えるんじゃなくてその間の変化に注目するみたいな所はギブソン的だといえる。
また関係ないけどアハ体験ってあったじゃん。最近テレビ見てないからまだやってんのかわかんないけど、脳科学の茂木さんのやつ。アハ体験で、写真が気付かないくらいゆっくり変化していってて、さあどこが変わったでしょう?みたいなの。あれすごいよね。見ててもぜんぜん分かんなかった。早回しで見せられるとアーハァーッってなる。いかに人間が変化しない物に鈍感か。あるいは人間は加速度に反応するってのもどっかで聞いたんだけど。地球も自転してることだし、ってまあそれはおいておこう。

ギブソンは上記の本の中で絵画と映画の視覚の問題について触れいている。つまり3次元の現実環境の認知ではなく2次元の画像について、動かない画像(絵画)と動く画像(映画)についてである。となるとそこでmossyaがこのブログ上ですべきことは一つ。ギブソンは絵画と映画のその中間であるところのアニメについての考察を見落としている…ッ!
もしこの本を書いた当時日本的なアニメが今くらいアメリカに広まっていたら、ギブソンはそれを取り上げたかもしれない。彼の理論にはギブソニアンとかっていうフォロワーがいるらしいんだけど、もしかしたらそんな人たちがもうアニメについて言及しているかもしれない。
まあそんなのしらねえよって感じで電波を発信するのがtake-subクオリティ。アニメが映ってる画面のギブソン的な知覚方法について、すこし考えてみる。

ところでさっき変化する物としない物についてテーブルを例に書いたけど、そういった意味では絵画や写真(動かない画像)の中に変化しない物(=不変項)を見つけるのはムリということになる。絵画や写真の周りを観察者が動き回って見ても、何も変化する物がないから、必然的に不変項も見つけられない。平面として変化するだけ。映画はまあカメラアイが観察点を代行するって考えれば大体おkなんだけど。写真、絵画についてはギブソンにとっても難しい問題であったらしく、一応説明もしてるけど少しやっつけ感というかゴリ押し感がある。環境が水晶体を通して網膜に映写(2D化)されるという従来のモデルにおいては、絵画、写真を見るというメカニズムは非常に単純に説明できた。でもギブソンの理論においてはそれが結構難しい問題になってしまっているっていう。

で、アニメについて。アニメが絵画と映画の中間だって書いた意図としては、さっきも書いたとおり、アニメは動く部分と動かない部分がはっきりしているから。「変化する」「しない」って言うのはテーブルの例のように観察者が動く場合もそうだけど、観察者が動かなくても逆に対象が動けばその動きの中で「変化するもの」「変化しないもの」を観察者は見つけるよね。つまりギブソン的には2Dの知覚も3D的に行うってことなのかな。

と、ここまで書いて。でもやっぱりギブソン的に平面を扱うのは難しい。というかいろいろ書いてても結論になかなか達しなさそうだったので、以下にはそのいろいろ書いたのの一部を上げていこうと思う。

2008年のアニメ、「魔法遣いに大切なこと 〜夏のソラ〜」(下図)は背景がリアルすぎるということで一瞬話題になったと記憶してる。このアニメでは写真を加工したものを背景に使っていて、キャラデザ自体が結構のぺっとしたミニマルな部類に入るというのもあって背景とキャラクター・小物類のあいだの絵的な表現のギャップが凄いことになってる。で、大抵のアニメは映画がそうであるようにタイヤか何かに乗っかったカメラ的な視点が一応あって、だからセル画に対してもスライドしたり拡大縮小したりして二次元の背景を撮るんでもカメラマンが空間内を動いて撮ったような映像にするわけじゃん。それがこのアニメだとあんまりない。基本的にカメラは固定で背景がパッと変わるまではキャラクターだけが動く感じ。まあギャルゲ的表現って言ったらそんな新しいことでもないんだけど、ギャルゲの背景なんてのはおまけで且つキャラと断絶してるでしょ。魔法使いに〜の背景は手抜きかもしれないけど結構見ごたえはあるしキャラレイヤとそれなりにリンクしてるんだよね。で、ここまで背景とキャラクター・小物のタッチにギャップがあると、動く場所と動かない場所っていうのが一瞬で分かっちゃうっていう。背景は動かないしカメラ(観察者)もあまり動かない。だから同じ小物(携帯とか本とか)でも背景に埋め込みで描かれたものと、レイヤーとして重ねられ動くように仕組まれたものは、それがどちらも動いていない状態であっても区別される。例えば図の中に描かれている小物、ポットとか鍋は背景の上にレイヤーで重ねられているということが明らかで、つまりそれらの小物には動く可能性が秘められている。一方、後ろの電子レンジやコンロに乗った鍋は背景に埋め込まれて描かれているため、私たちはそれらをはじめから動かないものとして捉える。動くか動かないかは重要ではなく、ここでは動きそうか動かなそうかが非常にシンプルな形(絵のタッチの違い)で観察者に提示されているということが重要。つまり、このアニメにおいて環境を知覚するということは、動いた物に対しての見え方の変化の仕方からその対象の不変項を見いだすという事後的なプロセスにはよらない。ここでは全く同じ対象を表現した物にあっても、タッチの違いという別の次元の要素にあらかじめ変化不変化の情報が含まれており、それが観察者が静止した画面から環境を知覚するのに一役買っていると。

でもこれはルール違反なんだよね。ギブソンは絵を文章のように読むという知覚の仕方を否定している。「知識」とか「学習」「推論」のようなバックアップが必要だっていう理論になるとダメ。そんなんもうムリじゃんwってね。行き詰ってその辺をネットで調べてたらやっぱりギブソンさん、批判されてたらしく、後から出てきた人はヴィトゲンシュタインの「seeing(見る)とseeing as(〜として見る)を区別した上でのseeing asの優位性」なんかを引用したりして、やっぱり「いかに」見るかってのは大事だよねー、みたいに新しい理論、というかギブソンとは別の理論を展開したということらしい。僕も「見方によってはどんな酷い物でも面白い」っていう持論を何度かこのブログでも展開しているし、まあ賛成だよね。でも50年代の理論がギブソンが死んだ後の80年代まで議論されてた(今も?)ってのはやっぱりギブソンの影響力が相当大きかったってことなんだろう。

ギブソン的にアニメを見る試みとしてもう少し書いたのが残ってるけど校正して気が向いたら上げる。