あいまいな画像
あいまいな画像または可逆図形は、2つ以上の異なる画像形式間の視覚システム解釈のグラフィカルな類似性およびその他のプロパティを活用する視覚形式です。これらは、多安定知覚の現象を引き起こすことで有名です。多安定知覚とは、安定ではあるが複数の知覚を提供できる画像の発生です。この典型的な例は、ウサギのアヒルとルービンの花瓶です。あいまいな画像は、多くの場合実験で使用される研究ツールであるため、心理学の分野にとって重要です。あいまいな画像を精神的に表現できるかどうかについてはさまざまな証拠がありますが、研究の大部分は、それらを精神的に適切に表現できないと理論付けています。ウサギのアヒルの画像は、このタイプの初期のもののようです。ドイツのユーモア雑誌FliegendeBlätterで最初に出版されました(1892年10月23日、147ページ)。
あいまいな画像の特定と解決
ミドルビジョンは、シーン内のすべての基本機能を個別の認識可能なオブジェクトグループに結合する視覚処理の段階です。この視覚の段階は、高レベルの視覚の前(シーンを理解する)と早期の視覚(画像の基本的な特徴を決定する)の後にあります。画像を認識して認識するとき、見ているオブジェクトを分類する必要があるときに中レベルのビジョンが使用されます。分類されたオブジェクトがグループの特定のメンバーとして認識される必要がある場合、高レベルのビジョンが使用されます。たとえば、中レベルの視覚を通して顔を知覚し、次に高レベルの視覚を通して身近な人の顔を認識します。中間レベルのビジョンと高レベルのビジョンは、あいまいな知覚入力で満たされた現実を理解するために重要です。
中間レベルのビジョンで画像を知覚する
画像を見るとき、最初にすることは、シーンのすべての部分を異なるグループに整理しようとすることです。これを行うために使用される最も基本的な方法の1つは、エッジを見つけることです。エッジには、家のエッジなどの明らかな知覚を含めることができ、人の顔の特徴のエッジなど、脳がより深く処理する必要があるという他の知覚を含めることができます。エッジを見つけるとき、脳の視覚システムは、照明のシャープなコントラストで画像上のポイントを検出します。オブジェクトのエッジの位置を検出できると、オブジェクトの認識に役立ちます。あいまいな画像では、エッジを検出することは、画像を知覚する人にとっては依然として自然に見えます。ただし、あいまいさを解決するために、脳はより深い処理を受けます。たとえば、オブジェクトと背景の間で輝度の大きさの反対の変化を伴う画像を考えてみてください(たとえば、上から、背景が黒から白に変化し、オブジェクトが白から黒に変化します)。反対のグラデーションは、最終的にオブジェクトと背景の輝度が等しくなるポイントに到達します。この時点で、知覚されるエッジはありません。これに対抗するために、視覚システムはエッジのセットではなく画像全体を接続し、エッジや非エッジではなくオブジェクトを見ることができるようにします。見るべき完全なイメージはありませんが、脳は物理的な世界の理解とあいまいな照明の実際の事件のためにこれを達成することができます。
曖昧な画像では、幻想はしばしば幻想的な輪郭から生成されます。幻想的な輪郭は、物理的な勾配が存在しない知覚された輪郭です。白い背景に白いオブジェクトが黒いオブジェクトを遮るように見える例では、白いシェイプは背景よりも明るく見え、このシェイプのエッジが幻想的な輪郭を作り出します。これらの架空の輪郭は、実際の輪郭と同様の方法で脳によって処理されます。視覚システムは、輝度勾配とほぼ同じ方法で提示される情報を超えた推論を行うことでこれを実現します。
ゲシュタルトのグループ化ルール
中間レベルのビジョンでは、視覚システムは、ゲシュタルトグループ化ルールと呼ばれる一連のヒューリスティックメソッドを使用して、あいまいさの解決に役立つオブジェクトの基本的な認識をすばやく識別します。これにより、グループの各部分を識別するのに時間がかかるのではなく、パターンや見慣れた画像を観察することで、知覚をすばやく簡単に行うことができます。これは、視覚システムがパターンの小さな変化を受け入れ、それでもパターン全体を認識するため、あいまいな画像の解決に役立ちます。ゲシュタルトのグループ化ルールは、視覚システムの経験の結果です。パターンが頻繁に認識されると、メモリに保存され、オブジェクト全体を再度調べる必要なく、簡単に再認識できます。たとえば、チェス盤を見ると、黒と白の交互の正方形のセットではなく、チェッカーパターンを認識します。
良い継続
良好な継続の原理は、視覚システムに継続するエッジを識別するための基礎を提供します。これは、線のセットが認識されると、線が一方向に続く傾向があることを意味します。これにより、視覚システムは、線が交差する点を特定することにより、複雑な画像のエッジを特定できます。たとえば、「X」形状で交差する2本の線は、2本の線が方向を変えて互いに反対の「V」形を形成するのではなく、斜めに移動する2本の線として認識されます。あいまいな画像の例は、ある点で交差する2本の曲線です。この交差点は、「X」と同じように認識されます。この場合、交差点は、互いに離れるのではなく交差する線として表示されます。魔術師は観客をだますために、よく続く幻想をよく使用します。
類似性
類似性の規則では、互いに類似した画像は、同じタイプのオブジェクトまたは同じオブジェクトの一部としてグループ化できると規定されています。したがって、2つの画像またはオブジェクトが似ているほど、それらをグループ化できる可能性が高くなります。たとえば、多くの円の中の2つの正方形がグループ化されます。それらは、色、サイズ、方向、およびその他のプロパティの類似性が異なる場合がありますが、最終的にはメンバーシップの度合いが異なるグループ化されます。
近接性、共通領域、接続性
近接性のグループ化プロパティ(ゲシュタルト)は、2つのオブジェクト間の空間距離です。 2つのオブジェクトが近いほど、同じグループに属する可能性が高くなります。この認識は、人があいまいであると認識しない限り、あいまいになる可能性があります。たとえば、視聴者からの距離と向きが異なる2つのオブジェクトが互いに近接しているように見え、3番目のオブジェクトが他のオブジェクトの1つに近いが遠くに見える場合があります。
画像上の共通領域を占めるオブジェクトは、すでに同じグループのメンバーであるように見えます。これには、独自の空間的位置を含めることができます。たとえば、2つのオブジェクトがグループ独自の空間の異なる領域を占有している場合です。オブジェクトは近接している場合がありますが、2つのオブジェクトを分離する色のしきい値など、さまざまな視覚的補助により、明確なグループの一部として表示されます。
さらに、オブジェクトは、各オブジェクトから線を引くなどの方法で視覚的に接続できます。これらの類似した階層的なルールは、一部のGestaltルールが他のルールをオーバーライドできることを示唆しています。
テクスチャのセグメンテーションと図地の割り当て
視覚システムは、画像内のテクスチャのパターンを検出することにより、あいまいさの解決にも役立ちます。これは、ゲシュタルトの原則の多くを使用して達成されます。テクスチャは、オブジェクト全体を区別するのに役立つ情報を提供できます。また、画像内の変化するテクスチャは、同じグループの一部である可能性がある異なるオブジェクトを明らかにします。多くの場合、テクスチャセグメンテーションルールは互いに協力し、競合します。テクスチャを調べると、画像のレイヤーに関する情報が得られ、背景、前景、およびオブジェクトが明確になります。
サイズと囲まれた
テクスチャの領域がテクスチャの別の領域を完全に囲むとき、それはおそらく背景です。さらに、画像内のテクスチャの小さな領域がフィギュアである可能性があります。
平行度と対称性
並列処理は、画像の図を明確にする別の方法です。画像内のさまざまなテクスチャの輪郭の向きによって、どのオブジェクトがグループ化されるかが決まります。通常、平行な輪郭は、同じオブジェクトまたはオブジェクトのグループへのメンバーシップを示唆します。同様に、輪郭の対称性も画像の形状を定義できます。
極値エッジと相対運動
極値エッジは、オブジェクトが別のオブジェクトの前または後ろにあることを示唆するテクスチャの変化です。これは、テクスチャの1つの領域のエッジのシェーディング効果が原因である可能性があり、奥行きを表現します。一部の極端なエッジ効果は、囲まれたサイズまたはサイズのセグメンテーションを圧倒する可能性があります。知覚されるエッジは、動きによるエッジに対するテクスチャの変化を調べることにより、オブジェクトを区別するのにも役立ちます。
あいまいな画像を使用して現実世界に隠す:カモフラージュ自然界では、迷彩は捕食者を逃れるために生物によって使用されます。これは、周囲の環境を模倣して、テクスチャセグメンテーションのあいまいさを作成することで実現されます。テクスチャと位置の顕著な違いを認識できなければ、捕食者は獲物を見ることができません。
オクルージョン
多くのあいまいな画像は、オブジェクトのテクスチャが突然停止するオクルージョンによって生成されます。オクルージョンとは、あるオブジェクトが別のオブジェクトの後ろまたは前にあることを視覚的に認識し、テクスチャのレイヤーの順序に関する情報を提供することです。オクルージョンの錯覚は、存在しないにもかかわらずオクルージョンが知覚される幻想的な輪郭の効果で明らかです。ここでは、あいまいな画像がオクルージョンのインスタンスであると認識されます。オブジェクトがオクルードされると、視覚システムにはオブジェクトの表示可能な部分に関する情報のみが含まれるため、残りの処理はより深く行われ、メモリが必要になります。
偶然の視点
偶発的な視点は、あいまいな画像を生成する単一の視覚的位置です。偶発的な視点では、オブジェクトが何であるかを区別するのに十分な情報が提供されません。多くの場合、この画像は誤って認識され、現実とは異なる錯覚を生み出します。たとえば、画像を半分に分割し、上半分を拡大し、空間内の知覚者からさらに遠くに配置することができます。この画像は、オブジェクトの2つの別々の半分の現実ではなく、空間内の単一の視点からの1つの完全な画像として認識されます。ストリートアーティストはしばしば視点のトリックを使用して、3次元に見える2次元のシーンを地面に作成します。
高レベルのビジョンを通してオブジェクトを認識する
オブジェクトを認識するだけでなく、先に進むことは、オブジェクトを認識することです。オブジェクトを認識することは、あいまいな画像を解決する上で重要な役割を果たし、メモリと事前知識に大きく依存します。オブジェクトを認識するために、視覚システムはそのおなじみのコンポーネントを検出し、その知覚的表現をメモリに保存されているオブジェクトの表現と比較します。これは、一般的な犬を表す「犬」など、オブジェクトのさまざまなテンプレートを使用して実行できます。グループのメンバーは互いに視覚的に大きく異なる場合があり、さまざまな角度から見ると外観が大きく異なるため、テンプレートメソッドは常に成功するとは限りません。視点の問題に対処するために、視覚システムは3次元空間でオブジェクトのよく知られているコンポーネントを検出します。知覚されるオブジェクトのコンポーネントがメモリ内のオブジェクトの同じ位置と向きにある場合、認識が可能です。調査では、画像の創造性が高い人ほど、あいまいな画像をよりよく解決できることが示されています。これは、画像内のパターンをすばやく識別できるためです。あいまいなイメージの精神的表現を作成する場合、通常のイメージと同様に、各部分が定義されてから精神的表現に配置されます。シーンが複雑になるほど、処理して表現に追加するのに時間がかかります。
奥行きの手がかりを回避する方法で描かれた図はあいまいになる場合があります。この現象の典型的な例は、ネッカーキューブ、および菱形タイル(キューブの等角図として表示)です。
メモリと最近の経験を使用する
私たちの記憶は、あいまいな画像の解決に大きな影響を与えます。視覚システムがオブジェクトを繰り返し分析および分類する必要なく、オブジェクトを識別および認識するのに役立つからです。メモリと事前の知識がなければ、類似したオブジェクトのいくつかのグループを含む画像を知覚することは困難です。どのオブジェクトもあいまいな表現を持つことがあり、オブジェクトの十分なメモリ認識なしに誤って間違ったグループに分類される可能性があります。この発見は、適切な知覚には事前の経験が必要であることを示唆しています。 Greeblesを使用して、物体認識における記憶の役割を示す研究が行われています。同様の視覚刺激への露出で参加者に呼び水をする行為は、あいまいさの解決の容易さにも大きな影響を及ぼします。
知覚障害
予知失認は、人が顔を識別できなくなる障害です。視覚システムは中間レベルの視覚を受けて顔を識別しますが、高レベルの視覚は顔が誰のものかを識別できません。この場合、視覚システムはあいまいなオブジェクト、顔を識別しますが、メモリを使用してあいまいさを解決することはできず、影響を受けた人は誰を見ているのか判断できません。