無香の変換
無香変換 (UT)は、特定の非線形変換を、統計の有限セットに関してのみ特徴付けられる確率分布に適用した結果を推定するために使用される数学関数です。無香変換の最も一般的な使用法は、カルマンフィルターの非線形拡張のコンテキストでの平均および共分散推定値の非線形投影です。作成者のJeffrey Uhlmannは、「無香」とは「Uhlmannフィルター」と呼ばれることを避けるために採用した任意の名前であると説明しました。
バックグラウンド
多くのフィルタリングおよび制御方法は、システムの状態の推定値を平均ベクトルおよび関連する誤差共分散行列の形式で表します。例として、関心のあるオブジェクトの推定2次元位置は、x {\ displaystyle xの分散を与える2x2共分散行列の形式で与えられる不確実性を持つ平均位置ベクトル{\ displaystyle}で表される場合があります。 }、y {\ displaystyle y}の分散、および2つの間の相互共分散。共分散がゼロであるということは、不確実性やエラーがないこと、およびオブジェクトの位置が平均ベクトルで指定されたとおりであることを意味します。
平均および共分散表現は、基礎となるがそれ以外は未知の確率分布の最初の2つのモーメントのみを提供します。動いている物体の場合、未知の確率分布は、特定の時間における物体の位置の不確実性を表す場合があります。不確実性の平均および共分散表現は数学的に便利です。これは、線形変換T {\ displaystyle T}を平均ベクトルm {\ displaystyle m}および共分散行列M {\ displaystyle M}にTm {\ displaystyle Tm}として適用でき、 TMTT {\ displaystyle TMT ^ {\ mathrm {T}}}。この線形性プロパティは、最初の生のモーメント(平均)と2番目の中心モーメント(共分散)を超えるモーメントに対して保持されないため、結果はすべてに依存するため、非線形変換から生じる平均と共分散を決定することは一般的に不可能です瞬間、最初の2つだけが与えられます。
共分散行列は多くの場合、平均に関連する予想二乗誤差として扱われますが、実際には、行列は実際の二乗誤差の上限として維持されます。具体的には、共分散行列M {\ displaystyle M}がm {\に関連付けられた実際の2乗誤差以上になるように、平均および共分散推定(m、M){\ displaystyle(m、M)}が保守的に維持されます。 displaystyle m}。数学的には、これはM {\ displaystyle M}から予想される2乗誤差(通常は不明)を減算した結果が半正定行列または正定行列であることを意味します。控えめな共分散推定値を維持する理由は、共分散が過小評価されると、ほとんどのフィルタリングおよび制御アルゴリズムが発散(失敗)する傾向があるためです。これは、誤って小さい共分散が不確実性が低いことを意味し、平均の精度で正当化されるよりも大きな重み(信頼性)をフィルターにかけるためです。
上記の例に戻ると、共分散がゼロの場合、任意の非線形関数f(x、y){\ displaystyle f(x、y)}に従って移動した後、オブジェクトの位置を決定することは簡単です。平均ベクトルに対する関数。共分散は、形質転換された平均値を0でない場合、一般的に、F(x、y)は{\ displaystyleのF(X、Y)}に等しくなく 、その前のみから変換確率分布の平均を決定することも可能ではないであろう平均と共分散。この不確定性を考えると、非線形に変換された平均と共分散は近似することしかできません。最も初期の近似は、非線形関数を線形化し、結果のヤコビ行列を与えられた平均と共分散に適用することでした。これは拡張カルマンフィルター(EKF)の基礎であり、多くの状況で悪い結果をもたらすことが知られていましたが、長年にわたって実用的な代替手段はありませんでした。
無香料の変換の動機
1994年、Jeffrey Uhlmannは、EKFがシステムの状態の非線形関数と部分分布情報(平均および共分散推定値の形で)を取得するが、不正確に既知の確率分布ではなく既知の関数に近似を適用することに注目しました。彼は、より良いアプローチは近似確率分布に適用される正確な非線形関数を使用することであることを示唆しました。このアプローチの動機は博士の論文で与えられており、そこでは無香変換という用語が最初に定義されました。
次の直観を考慮してください。 パラメータの数を固定すると、任意の非線形関数/変換を近似するよりも、与えられた分布を近似する方が簡単です。この直感に従って、目標は、平均および共分散情報をキャプチャすると同時に、任意の非線形方程式セットを介した情報の直接伝播を可能にするパラメーター化を見つけることです。これは、同じ1次および2次(および場合によってはそれ以上)のモーメントを持つ離散分布を生成することで実現できます。離散近似の各ポイントは直接変換できます。変換された集団の平均と共分散は、元の分布の非線形変換の推定値として計算できます。より一般的には、未知の分布の既知の統計量のセットを取得するために計算された点の離散分布への所定の非線形変換の適用は、 無香変換と呼ばれます。
言い換えると、与えられた平均および共分散情報は、 シグマポイントと呼ばれる点のセットに正確にエンコードできます。離散確率分布の要素として扱われる場合、与えられた平均および共分散に等しい平均および共分散を持ちます。この分布は、各ポイントに非線形関数を適用することで正確に伝播できます。変換されたポイントのセットの平均と共分散は、目的の変換された推定値を表します。このアプローチの主な利点は、非線形関数を線形関数に置き換えるEKFとは対照的に、非線形関数が完全に活用されることです。線形化の必要性を排除することは、推定品質の改善とは無関係の利点も提供します。直接的な利点の1つは、UTを特定の関数に適用できるのに対し、微分できない関数に対しては線形化ができない場合があることです。実用的な利点は、線形化ヤコビ行列を導出して実装する必要がなくなるため、UTの実装が簡単になることです。
シグマポイント
無香の変換を計算するには、最初に一連のシグマポイントを選択する必要があります。 Uhlmannの独創的な研究以来、多くの異なるシグマポイントのセットが文献で提案されています。これらのバリアントの徹底的なレビューは、Menegaz et。 al。一般に、n {\ displaystyle n}次元で与えられた平均と共分散を持つ離散分布を定義するには、n + 1 {\ displaystyle n + 1}シグマポイントが必要で十分です。
シグマポイントの正準セットは、もともとUhlmannによって提案された対称セットです。次の2次元の点のシンプレックスを考えます。
s1 = 12T、s2 = -12T、s3 = -12T {\ displaystyle s_ {1} = {\ frac {1} {\ sqrt {2}}} \ left ^ {\ mathrm {T}}、\ quad s_ { 2} =-{\ frac {1} {\ sqrt {2}}} \ left ^ {\ mathrm {T}}、\ quad s_ {3} =-{\ frac {1} {\ sqrt {2}} } \ left ^ {\ mathrm {T}}}上記の点のセットが平均s = 0 {\ displaystyle s = 0}および共分散S = I {\ displaystyle S = I}(単位行列)を持っていることを確認できます。任意の2次元の平均と共分散(x、X){\ displaystyle(x、X)}が与えられると、各ポイントにX {\ displaystyle X}の行列平方根を乗算し、xを追加することにより、目的のシグマポイントを取得できます。 {\ displaystyle x}。同様のシグマポイントの標準セットは、ゼロベクトルと単位行列の行を構成するポイントを取得し、ポイントのセットの平均を計算してから平均を減算することにより、任意の数の次元n {\ displaystyle n}で生成できます結果のセットの平均がゼロになるように各ポイントを計算し、ゼロ平均セットのポイントの共分散を計算し、その逆を各ポイントに適用して、セットの共分散が恒等式に等しくなるようにします。
Uhlmannは、±nX {\ displaystyle \ pm {\ sqrt {nX}}}およびゼロベクトルの列から2n + 1 {\ displaystyle 2n + 1}シグマポイントの対称セットを便利に生成できることを示しました。 X {\ displaystyle X}は与えられた共分散行列で、逆行列を計算する必要はありません。計算が効率的であり、点が対称分布を形成するため、状態推定の基礎となる分布が既知であるか、対称であると想定できる場合は常に、3番目の中心モーメント(スキュー)をキャプチャします。また、負の重みを含む重みを使用して、セットの統計に影響を与えることができることを示しました。ジュリアーは、任意の分布の3モーメント(スキュー)と対称分布の4モーメント(尖度)をキャプチャするためのシグマポイントを生成する手法も開発および検討しました。
例
無香変換は、未知の分布の部分的な特性評価に特定の関数を適用するために定義されますが、最も一般的な用途は、平均と共分散のみが与えられる場合です。一般的な例は、デカルト座標フレームから極座標へなど、ある座標系から別の座標系への変換です。
2次元の平均と共分散の推定値(m、M){\ displaystyle(m、M)}がデカルト座標で与えられていると仮定します。
m = T、M = {\ displaystyle m = ^ {\ mathrm {T}}、\ quad M = {\ begin {bmatrix} 1.44&0 \\ 0&2.89 \ end {bmatrix}}}極座標への変換関数f(x、y)→{\ displaystyle f(x、y)\ rightarrow}は次のとおりです。
r = x2 + y2、θ=arctan(yx){\ displaystyle r = {\ sqrt {x ^ {2} + y ^ {2}}}、\ quad \ theta = \ arctan \ left({\ frac { y} {x}} \ right)}標準的なシンプレックスシグマポイント(上記)のそれぞれにM12 = {\ displaystyle M ^ {\ frac {1} {2}} = {\ begin {bmatrix} 1.2&0 \\ 0&1.7 \ end {bmatrix}}を掛ける}そして平均値を追加すると、m {\ displaystyle m}が得られます。
m1 = + = m2 = + = m3 = + = {\ displaystyle {\ begin {aligned} m_ {1}&= + = \\ m_ {2}&= + = \\ m_ {3}&= + = \ end {aligned}}}上記の各ポイントに変換関数f(){\ displaystyle f()}を適用すると、次のようになります。
m + 1 = f(12.3,10.0)= m + 2 = f(10.8,6.40)= m + 3 = f(13.8,6.40)= {\ displaystyle {\ begin {aligned} {m ^ {+}} _ {1}&= f(12.3,10.0)= \\ {m ^ {+}} _ {2}&= f(10.8,6.40)= \\ {m ^ {+}} _ {3}&= f (13.8,6.40)= \ end {aligned}}}これら3つの変換されたポイントの平均、mUT =13Σi= 13m + i {\ displaystyle m_ {UT} = {\ frac {1} {3}} \ Sigma _ {i = 1} ^ {3} {m ^ {+ }} _ {i}}は、極座標での平均のUT推定値です。
mUT = {\ displaystyle m_ {UT} =}共分散のUT推定は次のとおりです。
MUT =13Σi= 13(m + i−mUT)2 {\ displaystyle M_ {UT} = {\ frac {1} {3}} \ Sigma _ {i = 1} ^ {3} \ left({m ^ { +}} _ {i} -m_ {UT} \ right)^ {2}}ここで、合計の2乗項はベクトル外積です。これは与える:
MUT = {\ displaystyle M_ {UT} = {\ begin {bmatrix} 2.00&0.0443 \\ 0.0443&0.0104 \ end {bmatrix}}}これは、線形化された平均と共分散と比較できます。
mlinear = f(12.3,7.6)= TMlinear =∇fM∇fT= {\ displaystyle {\ begin {aligned} m _ {\ text {linear}}&= f(12.3,7.6)= ^ {\ mathrm {T}} \\ M _ {\ text {linear}}&= \ nabla _ {f} M \ nabla _ {f} ^ {\ mathrm {T}} = {\ begin {bmatrix} 1.927&0.047 \\ 0.047&0.011 \ end {bmatrix}} \ end {aligned}}}この場合のUTと線形化された推定値の絶対差は比較的小さいですが、フィルタリングアプリケーションでは、小さな誤差の累積的な影響により、推定値の回復不能な発散が生じる可能性があります。共分散が過小評価されると、エラーの影響が悪化します。これは、フィルターの平均の精度が過信するためです。上記の例では、線形化された共分散推定値がUT推定値よりも小さいことがわかります。これは、線形化によって平均値の実際の誤差が過小評価された可能性が高いことを示唆しています。
この例では、元の推定値に関連付けられた実際の確率分布および非線形変換の適用後のその分布の平均と共分散の形で、グランドトゥルースなしでUTおよび線形化推定値の絶対精度を決定する方法はありません、分析的にまたは数値積分により決定されます)。このような分析は、基礎となる分布のガウス性の仮定の下で座標変換に対して実行されており、UT推定値は、線形化から得られるものよりもはるかに正確である傾向があります。
実証分析により、n + 1 {\ displaystyle n + 1}シグマポイントの最小シンプレックスセットの使用は、基礎となる分布がガウス分布の場合、2n {\ displaystyle 2n}ポイントの対称セットの使用よりも精度が大幅に低いことが示されました。 。これは、(m、M){\ displaystyle(m、M)}に関連付けられた基礎となる分布が対称である場合、上記の例のシンプレックスセットの使用は最良の選択ではないことを示唆しています。基礎となる分布が対称ではない場合でも、シンプレックスセットの非対称性は実際の分布の非対称性と一致しないため、シンプレックスセットは対称セットよりも精度が低い可能性があります。
例に戻ると、シグマポイントの最小対称セットは、単に平均として共分散行列M = {\ displaystyle M = {\ begin {bmatrix} 1.44&0 \\ 0&2.89 \ end {bmatrix}}}から取得できます。ベクトル、m = {\ displaystyle m =}(2M)1/2 = 2 ∗ = {\ displaystyle(2M)^ {1/2} = {\ sqrt {2}} * {\ beginの列のプラスとマイナス{bmatrix} 1.2&0 \\ 0&1.7 \ end {bmatrix}} = {\ begin {bmatrix} 1.697&0 \\ 0&2.404 \ end {bmatrix}}}:
m1 = + = m2 = − = m3 = + = m4 = − = {\ displaystyle {\ begin {aligned} m_ {1}&= + = \\ m_ {2}&=-= \\ m_ {3}& = + = \\ m_ {4}&=-= \ end {aligned}}}この構造は、上記の4つのシグマポイントの平均と共分散が(m、M){\ displaystyle(m、M)}であることを保証します。これは直接検証可能です。非線形関数f(){\ displaystyle f()}を各シグマポイントに適用すると、次のようになります。
m + 1 = m + 2 = m + 3 = m + 4 = {\ displaystyle {\ begin {aligned} {m ^ {+}} _ {1}&= \\ {m ^ {+}} _ {2 }&= \\ {m ^ {+}} _ {3}&= \\ {m ^ {+}} _ {4}&= \ end {aligned}}}これら4つの変換されたシグマポイントの平均、mUT =14Σi= 14m'i {\ displaystyle m_ {UT} = {\ frac {1} {4}} \ Sigma _ {i = 1} ^ {4} {m '} _ {i}}は、極座標での平均のUT推定値です。
mUT = {\ displaystyle m_ {UT} =}共分散のUT推定は次のとおりです。
MUT =14Σi= 14(m + i−mUT)2 {\ displaystyle M_ {UT} = {\ frac {1} {4}} \ Sigma _ {i = 1} ^ {4}({m ^ {+} } _ {i} -m_ {UT})^ {2}}ここで、合計の各二乗項はベクトル外積です。これは与える:
MUT = {\ displaystyle M_ {UT} = {\ begin {bmatrix} 1.823&0.043 \\ 0.043&0.012 \ end {bmatrix}}}UTと線形化された平均推定値の差は、変換の非線形性の効果の尺度を提供します。たとえば、変換が線形の場合、UTと線形化された推定値は同一になります。これにより、この差の2乗をUT共分散に追加して、平均の実際の誤差を過小評価しないようにします。このアプローチでは平均の精度は向上しませんが、共分散が過小評価される可能性を減らすことで、時間の経過とともにフィルターの精度を大幅に向上させることができます。
無香の変換の最適性
Uhlmannは、未知の確率分布の平均と共分散のみを考えると、同じ最初の2モーメントを持つ潜在的な分布が無限に存在するため、変換問題は不明確です。基礎となる分布の特性に関する先験的な情報や仮定がない場合、変換された平均と共分散を計算するために使用される分布の選択は、他と同様に合理的です。言い換えると、シグマポイントのセットによって提供されるものよりも優れた、与えられた平均と共分散を持つ分布の選択はありません。したがって、無香変換は自明に最適です。
最適化のこの一般的なステートメントは、UTのパフォーマンスに関する定量的なステートメントを作成するためにはもちろん役に立ちません。たとえば、線形化と比較して。その結果、彼、ジュリエおよびその他は、分布の特性および/または非線形変換関数の形式についてのさまざまな仮定の下で分析を実行しました。たとえば、関数が微分可能であり、線形化に不可欠な場合、これらの分析は、無香変換の予想された経験的に実証された優位性を検証します。
用途
無香変換は、無香カルマンフィルター(UKF)として知られるカルマンフィルターの非線形一般化を開発するために使用できます。このフィルターは、水中、地上および航空航法、および宇宙船を含む多くの非線形フィルタリングおよび制御アプリケーションで、EKFをほぼ置き換えました。無香の変換は、Riemann-Stieltjes最適制御の計算フレームワークとしても使用されています。この計算アプローチは、無香料の最適制御として知られています。
無香料カルマンフィルター
UhlmannとSimon Julierは、無香料カルマンフィルター(無香料カルマンフィルター(UKF)と呼ばれる)で無香料変換を使用すると、さまざまなアプリケーションでEKFよりも大幅にパフォーマンスが向上することを示すいくつかの論文を発表しました。 JulierとUhlmannは、負の重みを使用して想定される分布情報を取得するUKFのコンテキストで、特定のパラメーター化された無香変換の形式を使用して論文を発表しました。この形式のUTは、元の定式(元々はUhlmannによって提案された対称セット)が受けないさまざまな数値誤差の影響を受けやすくなっています。その後、ジュリアーは、負の重みを使用せず、これらの問題の影響を受けないパラメーター化されたフォームについて説明しました。