カテゴリー認識
カテゴリー認識とは、連続体に沿って変数が徐々に変化する場合に、異なるカテゴリーを認識する現象です。もともと聴覚刺激で観察されていましたが、現在では他の知覚モダリティに適用できることがわかっています。
音声知覚の運動理論
また、カテゴリに名前を付けるために使用する言語の構成要素についてはどうでしょうか。音声は— / ba /、/ da /、/ ga / —生得または学習ですか?それらについて最初に答えなければならない質問は、それらがカテゴリカテゴリであるか、または連続体に沿った単なる任意のポイントであるかということです。たとえば、baとpaのサウンドスペクトログラムを分析すると、両方が「voice-onset-time」と呼ばれる音響連続体に沿っていることがわかります。ビジュアルイメージを連続的に「モーフィング」するのに使用される手法と同様の手法で、ボイシングパラメーターを徐々に増加させることにより、/ ba /を徐々に/ pa /以上に「モーフィング」することができます。
Alvin Libermanと同僚(彼はその論文で音声の開始時間については話さなかった)は、人々が発声の連続に沿って変化する音を聞くと、/ ba / sと/ pa / sだけを聞き、その間に何も聞こえないと報告しました。この効果は、知覚品質が徐々に変化するのではなく、連続体に沿った特定のポイントであるカテゴリーから別のカテゴリーに急激にジャンプするというもので、「カテゴリー知覚」(CP)と呼ばれます。彼はCPがスピーチに特有であり、CPがスピーチを特別なものにし、「スピーチ知覚の運動理論」と呼ばれるようになったものにおいて、CPの説明はスピーチ生成の解剖学にあると示唆しました。
(現在は放棄されている)音声知覚の運動理論によれば、人々が/ ba /と/ pa /の間の急激な変化を認識する理由は、音声の聞こえ方は、人々が話すときにどのように生成するかに影響されるためです。この連続体に沿って変化しているのは音声開始時間です。/ba/の「b」は音声で、/ pa /の「p」は音声ではありません。しかし、合成の「モーフィング」装置とは異なり、人々の自然な音声装置はbaとpaの間の何かを生成することはできません。したがって、発声の連続体から音を聞くと、彼らの脳はそれを作り出すために必要なことと一致させようとすることでそれを知覚します。生成できるのは/ ba /または/ pa /だけなので、連続体に沿った合成刺激は/ ba /または/ pa /のどちらか近い方に知覚されます。同様のCP効果がba / daでも見られます。これらも音響的に連続体に沿って存在しますが、音声的には、/ ba /は2つの唇、/ da /は舌の先端と歯槽堤で形成され、解剖学では中間体は許可されません。
音声知覚の運動理論は、音声がどのように特別であり、なぜ音声がカテゴリー的に知覚されるのかを説明しました。感覚知覚は運動生産によって媒介されます。生産がカテゴリー化されている場合は常に、知覚はカテゴリー化されます。生産が連続する場合、知覚は連続します。実際、a / uのような母音のカテゴリは、ba / paまたはba / daよりもはるかに低いカテゴリであることがわかりました。
獲得された特徴
運動の生成が知覚を媒介する場合、このCP効果は音声を生成する学習の結果であると想定されます。エイマス等。 (1971)しかし、乳児は発話を始める前にすでに発話CPを持っていることがわかりました。おそらく、それは生得的な効果であり、話すことを学ぶために私たちを「準備」するように進化したのでしょう。しかし、Kuhl(1987)は、チンチラにも話すことを決して学んでいないにも関わらず「スピーチCP」があることを発見し、おそらくそうするように進化しなかったと思われます。 Lane(1965)は、知覚の不連続性を媒介する運動生産の不連続性がない純粋な感覚(視覚)連続体で、CP効果が学習だけで誘発されることを示しました。彼は、スピーチCPは結局特別ではなく、単にあなたが異なる反応をすることを学ぶ刺激がより特徴的になり、同じ反応をすることを学ぶ刺激がより類似するというローレンスの古典的なデモンストレーションの特別なケースであると結論付けました。
また、CPは、Libermanが当初考えていた、まったくまたはまったくない効果ではないことも明らかになりました。すべての/ pa / sが区別できず、すべての/ ba / sが区別できないわけではありません。異なる赤の色合いの違いを見ることができます。カテゴリ内の差異(pa1 / pa2またはred1 / red2)は、基礎となる物理的差異のサイズ(ボイシング)であっても、カテゴリ間の差異(pa2 / ba1またはred2 / yellow1)よりもはるかに小さいように見えます。 、波長)は実際には同じです。
識別および差別タスク
カテゴリ知覚の研究では、参加者の音の知覚を分類するために、差別と識別のタスクを含む実験がよく使用されます。音声開始時間(VOT)は、バイナリではなく連続体に沿って測定されます。英語の両唇停止音/ b /と/ p /は、同じ場所と発音様式の有声音および無声音に相当しますが、ネイティブスピーカーは、主にVOT連続体の位置によって音を区別します。これらの実験の参加者は、連続体上の明確な音素境界を確立します。異なるVOTを持つ2つのサウンドは、境界の同じ側にある場合、同じ音素として認識されます。参加者は、同じカテゴリの2つの音の間のVOTの差が大きい場合でも、音素境界の反対側の2つの音の間よりも、同じカテゴリのVOTにある2つの音を区別するのに時間がかかります。
識別
カテゴリ認識の識別タスクでは、参加者はしばしば音声などの刺激を識別する必要があります。 / p /と/ b /の間のVOT境界の知覚をテストする実験者は、VOT連続体のさまざまな部分に落ちるいくつかの音を再生し、ボランティアに各音を/ p /または/ b /として聞くかどうか尋ねます。このような実験では、境界の片側の音はほとんど普遍的に/ p /として、もう片側の音は/ b /として聞こえます。境界上または境界付近の刺激は、識別するのに時間がかかり、ボランティアによって異なる方法で報告されますが、中央のどこかの音ではなく/ b /または/ p /として認識されます。
差別
単純なAB差別タスクでは、参加者に2つのオプションが提示され、参加者は同一かどうかを判断する必要があります。実験での識別タスクの予測は、多くの場合、先行する識別タスクに基づいています。停止子音のカテゴリ認識を検証する理想的な識別実験では、ボランティアは境界の反対側にある刺激をより正確に識別し、境界の同じ側で偶然のレベルで識別します。
ABX差別タスクでは、ボランティアに3つの刺激が提示されます。 AとBは別個の刺激でなければならず、ボランティアは3番目の刺激Xのうち2つのうちのどちらが一致するかを決定します。この差別タスクは、単純なABタスクよりもはるかに一般的です。
Whorf仮説
Sapir-Whorf仮説(ローレンスが獲得した類似性/識別性効果は単に特別なケースである)によると、言語は人々が世界を知覚する方法に影響を与えます。たとえば、色はカテゴリに名前が付けられているという理由だけでカテゴリに基づいて認識されます。スペクトルの細分化は、文化や言語によって任意であり、学習され、変化します。しかし、Berlin&Kay(1969)は、これはそうではないことを示唆しました。ほとんどの文化と言語は同じように色のスペクトルを細分化して命名するだけでなく、そうでない人にとっても圧縮と分離の領域は同じです。私たちは皆、違いに名前を付けているかどうかに関係なく、あいまいな境界を挟んで、青がより似ており、緑がより似ていると考えています。この見解は、「1。色の用語は色の知覚に影響しますか?」という質問の違いを議論するRegier and Kay(2009)のレビュー記事で異議を唱えられました。および「2.色のカテゴリは、ほとんど任意の言語規則によって決定されますか?」。彼らは、ほとんどの人の脳の左半球に保存されている言語カテゴリがカテゴリ認識に影響するが、主に右目視野に影響し、この効果は同時の言語干渉タスクで排除されるという証拠を報告します。
普遍主義は、Sapir-Whorf仮説とは対照的に、知覚カテゴリーは生来のものであり、話す言語の影響を受けないという仮説です。
サポート
Sapir-Whorf仮説のサポートは、ある言語の話者が別の言語の話者とは異なる方法でカテゴリカルな知覚を実証する例を説明しています。そのような証拠の例を以下に示します。
Regier and Kay(2009)は、言語カテゴリが主に右目視野のカテゴリ認識に影響するという証拠を報告しました。右目視野は、言語機能も制御する脳の左半球によって制御されます。 Davidoff(2001)は、色弁別課題において、ネイティブスピーカーが同じ側面内よりも決定された青緑色の境界を越えて色刺激を容易に弁別する証拠を示したが、Berinmo "nol"および " wor」;ベリンモのスピーカーは逆に演奏しました。
現在の研究で一般的な理論は「弱ウォルフィニズム」です。これは、知覚には強力な普遍的要素がありますが、文化の違いは依然として影響を与えるという理論です。たとえば、1998年の研究では、普遍的知覚の証拠がある一方で、セツワナのスピーカーと英語のスピーカーの色の違いは、2つの言語グループの間にも著しい違いがありました。
CPの進化と学習
進化したCP
まず、母音に戻ります。 CPのシグネチャは、カテゴリ内圧縮および/またはカテゴリ間分離です。 CP効果のサイズは、単にスケーリング係数です。この圧縮/分離の「アコーディオン効果」、つまりCPの特徴的な機能です。この点で、母音の「弱い」CP効果は、そのモーターの生成はカテゴリカルではなく連続的ですが、知覚はこの基準によるカテゴリカルであるため、ba / paおよびba / daエフェクトと同じくらいのCPエフェクトです。 。しかし、色と同様に、効果は生来のもののように見えます。色と音声の両方の感覚カテゴリ検出器は、進化によってすでに「バイアス」されています。知覚された色と音声のスペクトルはすでに「歪んでいます」これらの圧縮/分離。
学習したCP
最近Goldstone(1994)によって複製および拡張されたLane / Lawrenceのデモンストレーションは、CPを単独で学習することで誘発できることを示しました。私たちの辞書にはカタログ化された無数のカテゴリがありますが、それらはカテゴリカルな認識によると生まれつきそうにありません。フォドールなどの自然主義者の理論家は、私たちのすべてのカテゴリーが生まれつきであることを示唆しているように見えることがあります。原色と音声カテゴリは生まれつきかもしれませんが、学習の結果として境界が変更されたり失われたりする可能性があり、学習だけで弱い二次境界が生成されるという最近のデモンストレーションがあります。
生来のCPの場合、私たちのカテゴリに偏った感覚検出器は、知覚が連続していた場合よりもはるかに簡単かつ確実に、用意された色と音声のカテゴリを選択します。
学習は、行動の比較的永続的な変化をもたらす認知プロセスです。学習は知覚処理に影響を与える可能性があります。学習は、個人が事前の経験または知識に基づいて特定の刺激を知覚する方法を変更することにより、知覚処理に影響を与えます。これは、以前に見た、観察した、または経験した方法によって、何かの知覚方法が変わることを意味します。学習の効果は、関連するプロセスを調べることにより、カテゴリカルな知覚で研究できます。
学習したカテゴリー認識は、いくつかの比較を通じて異なるプロセスに分割できます。プロセスは、カテゴリ間と比較のカテゴリグループ内に分けることができます。カテゴリグループ間とは、2つの別個のオブジェクトセットを比較するグループです。カテゴリグループ内には、オブジェクトの1つのセット内で比較するものがあります。被験者間の比較は、カテゴリー拡張効果につながります。カテゴリの拡張は、カテゴリの分類と境界がより広くなり、より大きなオブジェクトのセットを含む場合に発生します。言い換えれば、カテゴリーの拡大は、カテゴリーを定義するための「エッジライン」が広くなるときです。被験者内での比較により、カテゴリー圧縮効果が得られます。カテゴリ圧縮効果は、カテゴリ境界を狭くしてオブジェクトのセットを小さくすることに対応します(「エッジライン」は互いに近くなります)。そのため、カテゴリグループ間ではグループ定義がより厳格になり、カテゴリグループ内では定義がより厳格になります。
比較の別の方法は、教師ありグループと教師なしグループ比較の両方を調べることです。監視グループは、カテゴリが提供されているグループです。つまり、カテゴリは以前に定義されているか、ラベルが付けられています。監視なしグループは、カテゴリが作成されるグループです。つまり、カテゴリは必要に応じて定義され、ラベルは付けられません。
学習したカテゴリー認識を研究する際には、テーマが重要です。学習カテゴリは、テーマの存在に影響されます。テーマは学習の質を高めます。これは、特に既存のテーマが反対の場合に見られます。学習されたカテゴリー認識では、テーマは異なるカテゴリーの手がかりとして機能します。これらは、オブジェクトをカテゴリに配置するときに何を探すかを指定するのに役立ちます。たとえば、形状を知覚するとき、角度はテーマです。角度の数とそのサイズは、形状とキューのさまざまなカテゴリに関する詳細情報を提供します。 3つの角度は三角形を指し、4つは長方形または正方形を指します。角度のテーマとは反対に、円形性のテーマがあります。角度の鋭い輪郭と円の丸い曲率の明確なコントラストにより、学習が容易になります。
テーマと同様に、ラベルも学習されたカテゴリー認識にとって重要です。ラベルは、類似性に焦点を当てたカテゴリー処理を促進できる「名詞に似た」タイトルです。ラベルの強さは、感情的(または感情的)強さの分析、境界の透過性(突破能力)、および離散性の判断(剛性の測定)の3つの要因によって決定できます。ラベルのソースは異なり、教師なし/教師ありカテゴリと同様に、作成されるか、すでに存在します。ラベルは、ソースに関係なく知覚に影響します。仲間、個人、専門家、文化、コミュニティがラベルを作成できます。情報源はラベルの存在ほど重要ではないようです。重要なのはラベルがあることです。ラベルの強度(3つの要因の組み合わせ)とラベルが知覚に影響を与える度合いとの間には正の相関があります。つまり、ラベルが強いほど、ラベルは知覚に影響を与えます。
学習されたカテゴリ認識で使用されるキューは、カテゴリの学習および使用のプロセスでの事前の知識の容易な想起とアクセスを促進できます。カテゴリにメモリのキューがある場合、カテゴリ内のアイテムを簡単に思い出すことができます。前述のように、ラベルとテーマは両方ともカテゴリのキューとして機能するため、これらのカテゴリとそれらに属するオブジェクトの機能の記憶を支援します。
学習したカテゴリカルな知覚を促進する脳の構造がいくつか働いています。関連する領域と構造には、ニューロン、前頭前野、および側頭下皮質が含まれます。一般に、ニューロンは脳内のすべてのプロセスにリンクされているため、学習したカテゴリカルな知覚を促進します。脳の領域間でメッセージを送信し、カテゴリの視覚的および言語的処理を促進します。前頭前皮質は、「強いカテゴリカル表現の形成」に関与しています。下側頭皮質には、さまざまなオブジェクトカテゴリをコードするセルがあり、診断カテゴリディメンション、カテゴリ境界を区別する領域に沿って回転します。
カテゴリとカテゴリ認識の学習は、言葉のラベルを追加し、テーマを自己に関連させ、カテゴリをさらに分け、カテゴリの形成と定義を容易にする同様の機能をターゲットにすることで改善できます。
学習されたカテゴリー認識は、人間の種だけでなく、動物の種でも実証されています。研究は、人間、サル、げっ歯類、鳥、カエルを使用したカテゴリー認識を対象としています。これらの研究は多くの発見をもたらしました。彼らは主に、包含の始まりと終わりであるカテゴリーの境界の学習に焦点を当て、カテゴリー認識には学習された要素があるという仮説を支持します。
計算モデルとニューラルモデル
計算モデリング(Tijsseling&Harnad 1997; Damper&Harnad 2000)は、多くのタイプのカテゴリー学習メカニズム(たとえば、逆伝播と競合ネットワークの両方)がCPのような効果を示すことを示しています。バックプロパゲーションネットでは、入力を「表す」隠しユニットの活性化パターンが、学習中にカテゴリ内圧縮とカテゴリ間分離を形成します。他の種類のネットも同様の効果を示します。 CPは目的を達成するための手段のようです。すべてが同じ出力を生成する必要がある場合、それらの間で異なる入力は同様の内部表現に「圧縮」されます。また、異なる出力を生成する必要がある場合は、より分離されます。ネットワークの「バイアス」は、入力を正しい出力カテゴリにフィルターするものです。ネットは、同じカテゴリのメンバーによって共有され、それらを異なるカテゴリのメンバーから確実に区別する不変の特徴を選択的に検出します(多くの試行錯誤の後、エラー修正フィードバックによって導かれます)。ネットは、分類に関係ない他のすべてのバリエーションを無視することを学習します。
脳基盤
ニューラルデータは、CPと学習の相関関係を提供します。脳から記録された事象関連電位の違いは、被験者が見る刺激の知覚カテゴリーの違いと相関することがわかっています。ニューラルイメージングの研究では、これらの効果は、カテゴリの学習に成功した被験者の特定の脳領域に局在化され、さらには左右されることが示されています。
カテゴリー知覚は左前頭前野で識別され、これは音声ユニットのそのような知覚を示しますが、これは左上頭回の領域などの処理の初期領域ではありません。
言語誘発
生得および学習CPは感覚運動効果である:圧縮/分離バイアスは感覚運動バイアスであり、生物の感覚運動生活史中、学習CPの場合、または感覚運動生活史中に、おそらく感覚運動起源があった生来のCPの場合、種。ニューラルネットI / Oモデルもこの事実と互換性があります。I/ OバイアスはI / O履歴から派生します。しかし、辞書のカテゴリのレパートリーを見ると、それらの多くが私たちの生涯を通じて直接的な感覚運動の歴史を持っていた可能性は非常に低く、先祖の生涯においてもそうではありませんでした。実生活でユニコーンを見た人はどれくらいいますか?私たちはそれらの写真を見ましたが、それらの写真を最初に描いた人は何を見ましたか?そして、私が描くことも見ることもできない(または味と感触)カテゴリについてはどうでしょうか。
カテゴリの一部は、直接的な感覚運動の経験とは別のソースに由来する必要があります。ここで、言語に戻り、「仮説」に戻ります:カテゴリとそれに付随するCPは、言語のみで取得できますか?繰り返しますが、一連のカテゴリ名が直接的な感覚運動の経験を通じて「グラウンディング」されると、それらをブールの組み合わせ(男性=男性と人間)およびさらに高次の組み合わせ(学士号)に結合できることを示唆するいくつかのニューラルネットシミュレーション結果があります=未婚&男性)は、より抽象的な高次のカテゴリを直接感覚運動検出器と同じように選択するだけでなく、CP効果を継承し、独自の一部を生成します。学士号は、未婚者と人間の圧縮/分離を継承し、独自の分離/圧縮のレイヤーを追加します。
これらの言語誘発性CP効果は、人間の被験者で直接実証されるままです。これまでのところ、学習および生得の感覚運動CPのみが実証されています。後者は、世界に対する私たちの認識をゆがめることにおいて、命名と分類のWorfianの力を示しています。それは、色の用語の見かけの失敗から(そしておそらくエスキモーの雪の用語の見かけの失敗から)Whorf仮説をリハビリテーションするのに十分ですが、単なる語彙効果ではなく、本格的な言語効果であることを示すには、物事の名前の付け方だけでなく、私たちが世界について語られることによって、私たちの世界に対する認識も歪められることを示す必要があります。
感情
感情は人間の種の重要な特徴です。感情は抽象的な概念であり、表情を見ることで最も簡単に観察できます。感情とカテゴリカル知覚との関係は、しばしば表情を使用して研究されます。顔には大量の貴重な情報が含まれています。
感情は互いに分離されているため、カテゴリに分類されます。各感情には、反応、結果、および表現の別個の異なるセットが伴います。感情の感情と表現は自然な出来事であり、実際にはいくつかの感情の普遍的な出来事です。年齢、性別、人種、国、文化を越えて人間の種に普遍的であると考えられ、カテゴリー的に異なると考えられる6つの基本的な感情があります。これらの6つの基本的な感情は、幸福、嫌悪、悲しみ、驚き、怒り、恐れです。個別の感情アプローチによれば、人々はブレンドではなく、ある感情を経験し、他の感情は経験しません。感情的な表情のカテゴリー認識は、語彙カテゴリを必要としません。これらの6つの感情のうち、幸福が最も簡単に識別されます。
顔の表情を使用した感情の知覚は、カテゴリの定義と境界(基本的に、1つの感情が終了し、その後の感情が開始する「エッジライン」)に基づいて、わずかな性別の違いを明らかにします。怒りの感情は、男性によって表示されると、より簡単かつ迅速に知覚されます。しかし、女性によって描かれたときの幸せの感情にも同じ効果が見られます。これらの効果は、2つの感情(怒りと幸福)のカテゴリがこれらの特定の性別の他の特徴とより密接に関連しているため、本質的に観察されます。
言葉のラベルが感情に提供されますが、それらを明確に知覚する必要はありません。幼児の言語の前に、彼らは感情的な反応を区別できます。感情のカテゴリー認識は、「ハードワイヤードメカニズム」によるものです。特定の感情のラベルはないかもしれないが、それをそれ自身の感情として分類的に知覚できる文化からの言葉のラベルを示す追加の証拠が存在します。カテゴリへの感情の知覚も、眼球運動の追跡を使用して研究されており、眼球運動の応答には運動のみが必要であり、その後の言語反応がないため、暗黙の応答を示した。
感情のカテゴリー認識は、共同処理の結果である場合があります。他の要因がこの認識に関係している可能性があります。感情表現と不変の機能(比較的一貫性のある機能)は、しばしば一緒に機能します。人種は、表現と併せてカテゴリカルな知覚に寄与する不変の特徴の1つです。人種も社会的カテゴリーと見なすことができます。感情的なカテゴリー認識は、カテゴリー認識と次元認識の混合として見ることもできます。次元知覚には視覚的イメージが含まれます。処理が次元的であっても、カテゴリー認識が発生します。