كيف أشرح الفرق بين RPCA و PCA؟


الاجابه 1:

تحرير: Doh ، لقد أدركت أنك قد تسأل عن Robust-PCA وليس انحدار المكون الرئيسي (ويعرف أيضًا باسم الانحدار PCA). لماذا يستحق الأمر ، إليك إجابة على هذا الأخير.

في بعض الأحيان أثناء الانحدار ، ستكون مجموعات متغيرات الإدخال (المتغيرات المشتركة) متداخلة (انظر سؤال آخر حول التعدد الخطي). هذا يعني أن المدخلات التي تنبئ بشدة عن بعضها البعض تعني وجود نوع من التكرار من وجهة نظر المخرج: إذا كنت تستطيع التنبؤ

yy

جيد مع

xx

، لست بحاجة إلى نسخة أخرى قريبة من

xx

.

لسوء الحظ ، يرى انحدار OLS ذلك ويحاول التعويض عن طريق إسناد مسؤولية مماثلة إلى المدخلات المتداخلة. في المثال أعلاه ، فكر في عدد الطائرات المختلفة التي تكون شبه مثالية (بالمعنى المربّع الأصغر) ...

لانهائي ، أليس كذلك؟ أي طائرة تمر عبر النقاط ، بغض النظر عن الدوران حول النقاط الخضراء: تخيل نوعًا من المحور يرتكز في منتصف الهواء الذي يمر عبر النقاط الخضراء ثم يتم وضع الطائرة الحمراء عليها.

ومما زاد الطين بلة ، من خلال إزعاج البيانات قليلاً ، يمكن أن تكون أوزان الانحدار النهائية ، التي تتحكم بشكل أساسي في تدرج المستوى ، مختلفة تمامًا. هذا يشير إلى أن النموذج غير مستقر.

فما هي الطريقة المبدئية لدمج متغيرات المدخلات التي ترتبط؟ حسنًا ، إليك ما سيفعله الانحدار PCA:

أولاً ، ستعمل PCA على المدخلات (النقاط الزرقاء) ، أي العثور على خط أزرق على متن الطائرة XZ لعرض النقاط الزرقاء عليها (بحيث يتم تقليل مسافة الإسقاط الإجمالية). يعمل هذا الخط الآن كمحور جديد - أطلق عليه

bb

،

ويتم الآن حل مشكلة الانحدار الأصلية في إطار مرجع

byb-y

، الانحدار الخطي متغير واحد.

لذلك ، نحن نسمح لـ PCA بالعثور على تلك المجموعات ذات المتغيرات المتشابهة ، بدلاً من ترك الأمر يصل إلى OLS مع الخطر الكامن في عدم الاستقرار الموضح أعلاه.

وأخيرا ، لإعادة صياغة الانحدار إلى الأصل

xzyx-z-y

المساحة ، أيا كان معامل الانحدار الذي أعطاه المتغير b المعطى (هنا 0.5) ، سيتم تقاسمها بشكل منصف وفقا لأوزان المحور المشتق من PCA (وبالتالي فإن أوزان RPCA النهائية ستكون

(0.25,0.25)(0.25, 0.25)

).