התפלגות מרצ'נקו פסטור
פונקציית צפיפות ההסתברות
מאפיינים
פרמטרים
σ
{\displaystyle \sigma }
סטיית תקן ערכי המטריצה,
λ
∈
(
0
,
∞
)
{\displaystyle \lambda \in (0,\infty )}
תומך
x
∈
[
λ
−
,
λ
+
]
{\displaystyle x\in [\lambda ^{-},\lambda ^{+}]\!}
כאשר:
λ
−
=
σ
2
(
1
−
λ
)
2
,
λ
+
=
σ
2
(
1
+
λ
)
2
{\displaystyle \lambda ^{-}=\sigma ^{2}(1-{\sqrt {\lambda }})^{2},\lambda ^{+}=\sigma ^{2}(1+{\sqrt {\lambda }})^{2}}
פונקציית צפיפות הסתברות (pdf)
(
1
−
1
λ
)
+
δ
0
+
(
λ
+
−
x
)
(
x
−
λ
−
)
2
π
σ
2
λ
x
1
[
λ
−
,
λ
+
]
(
x
)
d
x
{\displaystyle (1-{\frac {1}{\lambda }})_{+}\delta _{0}+{\frac {\sqrt {(\lambda ^{+}-x)(x-\lambda ^{-})}}{2\pi \sigma ^{2}\lambda x}}1_{[\lambda ^{-},\lambda ^{+}]}(x)dx\!}
תוחלת
σ
2
{\displaystyle \sigma ^{2}}
שונות
σ
4
λ
{\displaystyle \sigma ^{4}\lambda }
התפלגות מרצ'נקו פסטור היא פונקציית התפלגות מתחום המטריצות האקראיות . השימוש העיקרי בה הוא תיאור ההתנהגות האסימפטוטית של ערכים עצמיים של מטריצות אקראיות בעלות ערכים ממשיים, בלתי תלויים ושווי התפלגות.
ההתפלגות (שלעיתים נקראת גם חוק מרצ'נקו-פסטור) קרויה על שם צמד המתמטיקאים הסובייטים וולודימיר מרצ'נקו וליאוניד פסטור שהוכיחו אותה בשנת 1967.
תהי
X
{\displaystyle X}
מטריצה אקראית בגודל
m
×
n
{\displaystyle m\times n}
שערכיה הם משתנים מקריים בלתי תלויים ושווי התפלגות המקיימים
E
[
X
i
j
]
=
0
{\displaystyle E[X_{ij}]=0}
ו-
E
[
X
i
j
2
]
=
σ
2
<
∞
{\displaystyle E[X_{ij}^{2}]=\sigma ^{2}<\infty }
לכל
1
≤
i
≤
m
,
1
≤
j
≤
n
{\displaystyle 1\leq i\leq m,1\leq j\leq n}
. בנוסף נניח כי
m
,
n
→
∞
{\displaystyle m,n\rightarrow \infty }
כך ש-
m
n
→
λ
∈
(
0
,
∞
)
{\displaystyle {\frac {m}{n}}\rightarrow \lambda \in (0,\infty )}
, ונסמן
λ
−
=
σ
2
(
1
−
λ
)
2
,
λ
+
=
σ
2
(
1
+
λ
)
2
{\displaystyle \lambda ^{-}=\sigma ^{2}(1-{\sqrt {\lambda }})^{2},\lambda ^{+}=\sigma ^{2}(1+{\sqrt {\lambda }})^{2}}
.
נסמן
Y
=
1
n
X
X
T
{\displaystyle Y={\frac {1}{n}}XX^{T}}
. נשים לב כי
Y
{\displaystyle Y}
מטריצה חיובית ויהיו
λ
1
,
.
.
.
,
λ
m
{\displaystyle \lambda _{1},...,\lambda _{m}}
ערכיה העצמיים. כמו כן, נסמן ב-
μ
m
{\displaystyle \mu _{m}}
את פונקציית התפלגות הערכים העצמיים שלה (Empirical Spectral Measure) אשר אותה נרצה לאמוד. פונקציית ההתפלגות מוגדרת לכל קבוצה
A
{\displaystyle A}
חלקית של
R
{\displaystyle \mathbb {R} }
על ידי:
μ
H
(
A
)
=
1
n
#
{
eigenvalues of
H
in
A
}
,
A
⊂
R
.
{\displaystyle \mu _{H}(A)={\frac {1}{n}}\,\#\left\{{\text{eigenvalues of }}H{\text{ in }}A\right\},\quad A\subset \mathbb {R} .}
או באמצעות הניסוח השקול:
μ
H
(
A
)
=
1
n
∑
i
δ
λ
i
{\displaystyle \mu _{H}(A)={\frac {1}{n}}\sum _{i}\delta _{\lambda _{i}}}
דוגמה: בכחול היסטוגרמת ערכים עצמיים של
Y
{\displaystyle Y}
כאשר
X
{\displaystyle X}
בגודל
10000
×
5000
{\displaystyle 10000\times 5000}
ובצהוב התפלגות מרצ'נקו פסטור עבור
λ
=
0.5
{\displaystyle \lambda =0.5}
כאשר תנאי המשפט מתקיימים, הפונקציה
μ
m
{\displaystyle \mu _{m}}
מקיימת
μ
m
→
μ
{\displaystyle \mu _{m}\rightarrow \mu }
כאשר
μ
{\displaystyle \mu }
היא פונקציה המוגדרת באופן הבא:
המקרה
0
<
λ
≤
1
{\displaystyle 0<\lambda \leq 1}
במקרה זה מתקיים כי המטריצה
Y
{\displaystyle Y}
היא בסבירות גבוהה הפיכה והפונקציה
μ
{\displaystyle \mu }
מוגדרת על ידי:
d
μ
(
x
)
=
1
2
π
σ
2
λ
x
(
λ
+
−
x
)
(
x
−
λ
−
)
1
[
λ
−
,
λ
+
]
(
x
)
d
x
{\displaystyle d\mu (x)={\frac {1}{2\pi \sigma ^{2}\lambda x}}{\sqrt {(\lambda ^{+}-x)(x-\lambda ^{-})}}1_{[\lambda ^{-},\lambda ^{+}]}(x)dx}
המקרה
λ
>
1
{\displaystyle \lambda >1}
דוגמה: בכחול היסטוגרמת ערכים עצמיים של
Y
{\displaystyle Y}
כאשר
X
{\displaystyle X}
בגודל
2000
×
3000
{\displaystyle 2000\times 3000}
ובצהוב התפלגות מרצ'נקו פסטור עבור
λ
=
1.5
{\displaystyle \lambda =1.5}
במקרה זה למטריצה
Y
{\displaystyle Y}
יש ערך עצמי 0 עם ריבוב התלוי בפרמטר
λ
{\displaystyle \lambda }
. זה בא לידי ביטוי בפונקציה בתור נקודת מסה
μ
{\displaystyle \mu }
בנקודה 0. השינוי ביחס למקרה
λ
≤
1
{\displaystyle \lambda \leq 1}
מתקבל על ידי הוספה של של הביטוי
(
1
−
1
λ
)
δ
0
{\displaystyle (1-{\frac {1}{\lambda }})\delta _{0}}
כאשר
δ
0
{\displaystyle \delta _{0}}
זוהי פונקציית דלתא , כך שבמקרה זה הפונקציה
μ
{\displaystyle \mu }
היא:
d
μ
(
x
)
=
(
1
−
1
λ
)
δ
0
+
1
2
π
σ
2
λ
x
(
λ
+
−
x
)
(
x
−
λ
−
)
1
[
λ
−
,
λ
+
]
(
x
)
d
x
{\displaystyle d\mu (x)=(1-{\frac {1}{\lambda }})\delta _{0}+{\frac {1}{2\pi \sigma ^{2}\lambda x}}{\sqrt {(\lambda ^{+}-x)(x-\lambda ^{-})}}1_{[\lambda ^{-},\lambda ^{+}]}(x)dx}
לעיתים מקובל לחבר את שני המקרים לביטוי אחד באופן הבא:
מגדירים את הפונקציה
(
x
)
+
=
m
a
x
(
x
,
0
)
{\displaystyle (x)_{+}=max(x,0)}
ובכך ניתן להחליף את המחובר הראשון עם הביטוי
(
1
−
1
λ
)
+
δ
0
{\displaystyle (1-{\frac {1}{\lambda }})_{+}\delta _{0}}
ובכך מקבלים ביטוי יחיד עבור שני המקרים.
במקרה זה מתקיים
λ
−
=
0
,
λ
+
=
4
{\displaystyle \lambda ^{-}=0,\lambda ^{+}=4}
וכן:
d
μ
(
x
)
=
1
2
π
x
(
4
−
x
)
x
1
[
0
,
4
]
(
x
)
d
x
{\displaystyle d\mu (x)={\frac {1}{2\pi x}}{\sqrt {(4-x)x}}1_{[0,4]}(x)dx}
עבור החלפת המשתנים
x
=
u
2
,
d
x
=
2
u
d
u
{\displaystyle x=u^{2},dx=2udu}
מקבלים:
d
μ
(
u
)
=
1
2
π
u
2
(
4
−
u
2
)
u
2
1
[
0
,
2
]
(
u
)
∗
2
u
d
u
=
1
π
(
4
−
u
2
)
1
[
0
,
2
]
(
u
)
d
u
{\displaystyle d\mu (u)={\frac {1}{2\pi u^{2}}}{\sqrt {(4-u^{2})u^{2}}}1_{[0,2]}(u)*2udu={\frac {1}{\pi }}{\sqrt {(4-u^{2})}}1_{[0,2]}(u)du}
התפלגות זו נקראת גם "חוק רבע המעגל". ניתן לשים לב לדמיון הרב בין ביטוי זה להתפלגות חצי המעגל של ויגנר .
עבור
k
≥
1
{\displaystyle k\geq 1}
המומנט ה-
k
{\displaystyle k}
של ההתפלגות נתון על ידי:
∑
r
=
0
k
−
1
σ
2
k
r
+
1
(
k
r
)
(
k
−
1
r
)
λ
r
=
σ
2
k
k
∑
r
=
0
k
−
1
(
k
r
)
(
k
r
+
1
)
λ
r
{\displaystyle \sum _{r=0}^{k-1}{\frac {\sigma ^{2k}}{r+1}}{\binom {k}{r}}{\binom {k-1}{r}}\lambda ^{r}={\frac {\sigma ^{2k}}{k}}\sum _{r=0}^{k-1}{\binom {k}{r}}{\binom {k}{r+1}}\lambda ^{r}}
מהצבה של
k
=
1
{\displaystyle k=1}
ניתן לחשב כי תוחלת ההתפלגות היא
σ
2
{\displaystyle \sigma ^{2}}
. כעת על ידי ההצבה
k
=
2
{\displaystyle k=2}
השונות שמתקבלת היא
σ
4
λ
{\displaystyle \sigma ^{4}\lambda }
.
אחת הדרכים להוכחת המשפט היא באמצעות שיטת המומנטים . מכיוון שהתומך של
μ
{\displaystyle \mu }
קומפקטי היא נקבעת באופן בלעדי באמצעות המומנטים שלה. חישוב ישיר מראה כי
∫
x
k
d
μ
=
σ
2
k
k
∑
r
=
0
k
−
1
(
k
r
)
(
k
r
+
1
)
λ
r
{\displaystyle \int x^{k}d\mu ={\frac {\sigma ^{2k}}{k}}\sum _{r=0}^{k-1}{\binom {k}{r}}{\binom {k}{r+1}}\lambda ^{r}}
המשפט מוכח באמצעות שימוש בלמה של בורל-קנטלי , בכך שמוכיחים כי
E
[
∫
x
k
d
μ
m
]
→
∫
x
k
d
μ
{\displaystyle \mathbb {E} [\int x^{k}d\mu _{m}]\rightarrow \int x^{k}d\mu }
וגם
V
a
r
(
∫
x
k
d
μ
m
)
≤
C
k
n
2
{\displaystyle Var(\int x^{k}d\mu _{m})\leq {\frac {C_{k}}{n^{2}}}}
טרנספורמציית סטילטיס של ההתפלגות נתונה על ידי הפונקציה:
s
(
z
)
=
σ
2
(
1
−
λ
)
−
z
+
(
z
−
σ
2
(
λ
+
1
)
)
2
−
4
λ
σ
4
2
λ
z
σ
2
{\displaystyle s(z)={\frac {\sigma ^{2}(1-\lambda )-z+{\sqrt {(z-\sigma ^{2}(\lambda +1))^{2}-4\lambda \sigma ^{4}}}}{2\lambda z\sigma ^{2}}}}
עבור z מספר מרוכב בעל ערך מדומה אי-שלילי, וכאשר השורש הריבועי נלקח גם כן להיות בעל ערך מדומה אי-שלילי.
פונקציה זו היא פתרון למשוואה הריבועית
λ
σ
2
z
s
(
z
)
2
+
[
z
+
σ
2
(
λ
+
1
)
]
s
(
z
)
+
1
=
0
{\displaystyle \lambda \sigma ^{2}zs(z)^{2}+[z+\sigma ^{2}(\lambda +1)]s(z)+1=0}
טרנספורמציית סטילטיס משמשת גישה נוספת להוכחה של המשפט באופן הבא:
תחילה מראים כי הטרנספורמציה של
μ
m
{\displaystyle \mu _{m}}
מרוכזת סביב התוחלת שלה, כלומר אם נסמן את הטרנספורמציה שלה ב-
g
(
z
)
{\displaystyle g(z)}
אז מתקיים:
g
(
z
)
−
E
[
g
(
z
)
]
→
0
,
m
→
∞
{\displaystyle g(z)-\mathbb {E} [g(z)]\rightarrow 0,m\rightarrow \infty }
בנוסף, יש להראות כי פונקציה זו פותרת את המשווה:
λ
σ
2
z
g
(
z
)
2
+
[
z
+
σ
2
(
λ
+
1
)
]
g
(
z
)
+
1
=
ϵ
m
{\displaystyle \lambda \sigma ^{2}zg(z)^{2}+[z+\sigma ^{2}(\lambda +1)]g(z)+1=\epsilon _{m}}
כאשר
ϵ
m
→
0
{\displaystyle \epsilon _{m}\rightarrow 0}
עבור
m
→
∞
{\displaystyle m\rightarrow \infty }
.
לבסוף מראים יציבות של המשוואה האחרונה.
דוגמה: בכחול היסטוגרמת ערכים עצמיים של
Y
{\displaystyle Y}
כאשר
X
{\displaystyle X}
בגודל
2000
×
1000
{\displaystyle 2000\times 1000}
ובצהוב התפלגות מרצ'נקו פסטור עבור
λ
=
0.5
{\displaystyle \lambda =0.5}
. בדוגמה זו במטריצה המקורית היו 3 ערכים עצמיים: 1,4,5. באופן צפוי רק 2 מהערכים העצמיים של המטריצה הרועשת נמצאים מחוץ לתומך, ואילו השלישי "נבלע" בתוך הרעש
ערכים מורחבים – מודל spiked covariance
דוגמה לשימוש בהתפלגות מרצ'נקו פסטור היא במודל spiked covariance. כאשר עובדים עם מטריצה שערכיה רועשים, ניתן לעיתים להניח כי הרעש מבוטא כמטריצה שערכיה הם שווי התפלגות ובלתי תלויים, ולכן ערכיה העצמיים מתפלגים לפי מרצ'נקו פסטור.
כעת מוסיפים למטריצת הרעש את המטריצה המקורית, מקבלים שערכיה העצמיים של המטריצה המקורית לא השתנו בהרבה, ולכן אם הם נמצאים מחוץ לתומך של מרצ'נקו פסטור ניתן יהיה לזהות אותם מבין הערכים העצמיים של המטריצה החדשה. בנוסף ניתן יהיה לשחזר בקירוב את הערך העצמי המקורי ואת הווקטור העצמי המתאים לו.
דרך זו היא דוגמה להפחתת רעשים (אנ' ) בעזרת התפלגות מרצ'נקו פסטור.
ניתן להיעזר בהתפלגות במרצ'נקו פסטור בשימוש ב-PCA . השימוש בהתפלגות עוזר למצוא את הרכיבים העיקריים שיעזרו לאפיין את הסיגנל המקורי, ולהפריד אותם מרכיבים אחרים שככל הנראה מאפיינים רעש. בדרך זו אפשר לחשוב על קצה התומך הימני של ההתפלגות בתור "סף" אשר קובע באילו ערכים עצמיים (או באופן שקול רכיבים עיקריים) נשתמש ובאילו לא.
מלבד הפחתת רעשים, השילוב בטכניקה זו עוזר גם בכיווץ, ובהבנה טובה יותר של המידע, והוא נפוץ במגוון תחומים, ביניהם: רפואה , גנומיקה וביואינפורמטיקה , ניתוח טכני , כיווץ תמונות וסרטונים, אסטרונומיה , ועוד.