مثبت کاذب و منفی کاذب

مثبت کاذب به خطایی در گزارش داده گفته می‌شود که در آن، نتیجهٔ آزمایش به‌طور نادرست، نشان دهنده وجود یک حالت باشد؛ در حالی که در واقع آن حالت وجود نداشته باشد. منفی کاذب نیز دقیقاً خطایی برعکس مثبت کاذب است که در آن، نتیجه آزمایش به‌طور نادرست، عدم حضور حالتی را نشان دهد؛ در حالی که آن حالت وجود دارد این دو نوع خطا ممکن است در یک آزمایش دودویی رخ دهند. در نقطه مقابل این دو نوع خطا، دو نتیجه درست یا همان مثبت درست و منفی درست قرار دارد. از این دو عبارت مثبت و منفی کاذب یا مثبت و منفی درست در طبقه‌بندی‌های آماری و نیز علم پزشکی استفاده می‌شود^[۱]

در آزمون فرض آماری مفاهیم مشابهی به نام خطاهای نوع اول و دوم شناخته شده که در آن‌ها، نتیجه مثبت، فرض صفر را رد کرده و نتیجه منفی، آن را رد نمی‌کند. این اصطلاحات غالباً به جای یکدیگر به‌کار برده می‌شوند؛ اما به دلیل تفاوت بین آزمایش پزشکی و آزمایش فرضی آماری، در تفسیر و تعبیر آن‌ها اختلاف وجود دارد.

خطای مثبت کاذب

یک خطای مثبت کاذب یا مثبت کاذب نتیجه ای است که نشان می‌دهد یک حالت فرضی ویژه وجود دارد؛ در حالی که این‌طور نیست. به عنوان مثال، آزمایش بارداری که نشان می‌دهد زنی باردار است؛ درحالی که زن باردار نیست. برای مثالی دیگر می‌توان به محکومیت یک فرد بی گناه اشاره کرد.

خطای مثبت کاذب یک خطای نوع اول است و زمانی حادث می‌شود که آزمونگر تنها به بررسی یک حالت می‌پردازد و نتیجه آزمایش به اشتباه، مثبت می‌شود. باید توجه داشت که بین خطای نوع اول و احتمال اشتباه از آب درآمدن نتیجه مثبت آزمایش، تفاوت قائل شویم؛ که در آن صورت آن را خطر مثبت کاذب می‌نامند.^[۲]

خطای منفی کاذب

خطای منفی کاذب، یا منفی کاذب، نتیجه آزمایش است که به اشتباه نشان می‌دهد که یک شرط وجود ندارد؛ درحالی که در واقع وجود دارد. به عنوان مثال، هنگامی که آزمایش بارداری نشان می‌دهد زن باردار نیست، اما او باردار است. یک مثال دیگر زمانی است که فردی گناه‌کار، تبرئه شود.

خطای منفی کاذب یک خطای نوع دوم است و خلاف خطای مثبت کاذب، زمانی حادث می‌شود که آزمونگر تنها به بررسی یک حالت می‌پردازد و نتیجه آزمایش به اشتباه، منفی می‌شود.^[۳]

عبارت‌های مرتبط

نرخ مثبت و منفی کاذب

نرخ مثبت کاذب نسبت تمام منفی‌هایی است که هنوز نتایج آزمون مثبت را به همراه دارند؛ یعنی احتمال وجود حالتی که وجود ندارد.

نرخ مثبت کاذب برابر است با سطح اهمیت. ویژگی آزمون برابر است با ۱ منهای نرخ مثبت کاذب.

در آزمون فرض آماری، این خطا با حرف یونانی α نشان داده می‌شود و ۱ − α به عنوان ویژگی آزمون تعریف می‌شود. افزایش ویژگی آزمون، احتمال خطای نوع اول را پایین می‌آورد؛ اما ممکن است احتمال خطای نوع دوم را بالا ببرد. (منفی‌های کاذب که فرضیه جایگزین را، در صورت صحت، رد می‌کنند). ^[الف]

در تکمیل آنچه اشاره شد، نرخ منفی کاذب نسبت تمام مثبت‌هایی است که هنوز نتایج آزمون منفی را به همراه دارند؛ یعنی احتمال عدم وجود حالتی که وجود دارد.

در آزمون فرض آماری، این خطا با حرف β نمایش داده می‌شود. " توان آماری " یا " حساسیت " آزمایش برابر با ۱-β است.

ابهام در تعریف نرخ مثبت کاذب

اصطلاح نرخ کشف کاذب (False Discovery Rate) را کلکیون (۲۰۱۴)^[۴] و به معنی این احتمال که یک نتیجه «مهم» مثبت کاذب بوده، به‌کار برد. بعداً کلکیون (۲۰۱۷)^[۲] از اصطلاح خطر مثبت کاذب (False Positive Risk) برای همان مقدار استفاده کرد، تا با اصطلاح نرخ کشف کاذب که افراد در مقایسه‌های چندگانه از آن استفاده می‌کنند، اشتباه نشود. اصلاحات برای مقایسه‌های چندگانه فقط تصحیح نرخ خطای نوع اول است، بنابراین نتیجه یک مقدار p (تصحیح شده) است؛ بنابراین آنها به همان تفسیر غلط مانند هر مقدار p دیگر مستعد هستند. خطر مثبت کاذب همیشه بیشتر از مقدار p معمولاً بیشتر است. سردرگمی میان این دو ایده، خطای شرایط تحمیل شده، موجب استفاده نادرست اصطلاحات مرتبط با آن شده‌است.^[۵] به دلیل ابهام بیانی در این زمینه، ضروری است که در هر مقاله موضوع آن را به‌درستی تعریف یا بازشناسی کنیم. خطرهای تکیه بر -ارزش‌های پی در مقاله کلکیون (۲۰۱۷) با اشاره به اینکه حتی مشاهده ۰٫۰۰۱ = P لزوماً شواهد قوی در برابر فرضیه صفر نیست، واضح می‌نماید. با وجود این واقعیت که نسبت احتمال به نفع فرضیه جایگزین نسبت به صفر نزدیک است به ۱۰۰، چنانچه این فرضیه غیرممکن می‌بود با احتمال قبلی اینکه اثر واقعی ۰٫۱ باشد، حتی مشاهده p = ۰٫۰۰۱ می‌تواند به نرخ ۸ درصد مثبت کاذب داشته باشد. این نرخ حتی به سطح ۵ درصد هم نمی‌رسد. در نتیجه، توصیه شده‌است^[۶] که هر مقدار p باید توسط احتمال قبلی همراه شود که بشود فرض کرد تا به یک نرخ خطر مثبت کاذب ۵ درصدی دست یافت. به عنوان مثال، اگر در یک آزمایش ۰٫۰۵ = p مشاهده کنیم، باید ٪۸۷ مطمئن باشیم که به عنوان یک اثر واقعی قبل از انجام آزمایش برای دستیابی به خطر مثبت کاذب ٪۵ وجود دارد.

ویژگی عامل گیرنده

مقاله " مشخصه عملیاتی گیرنده " در مورد پارامترهای پردازش سیگنال آماری بر اساس نسبت خطاها در انواع مختلف بحث می‌کند.

یادداشت

↑ هنگام ایجاد الگوریتم یا آزمایش تشخیص، باید تعادل بین خطرات منفی کاذب و مثبت کاذب انتخاب شود. معمولاً یک آستانه وجود دارد که قبل از اینکه الگوریتم یک مسابقه را گزارش کند، باید یک مسابقه با یک نمونه معین نزدیک شود. هرچه این آستانه بالاتر باشد، منفی‌های کاذب تر و مثبت کاذب نیز کمتر می‌شوند.

منابع

↑ False Positives and False Negatives
↑ ^۲٫۰ ^۲٫۱ Colquhoun, David (2017). "The reproducibility of research and the misinterpretation of p-values". Royal Society Open Science. 4 (12): 171085. doi:10.1098/rsos.171085. PMC 5750014. PMID 29308247.
↑ Banerjee, A; Chitnis, UB; Jadhav, SL; Bhawalkar, JS; Chaudhury, S (2009). "Hypothesis testing, type I and type II errors". Ind Psychiatry J. 18 (2): 127–31. doi:10.4103/0972-6748.62274. PMC 2996198. PMID 21180491.
↑ Colquhoun, David (2014). "An investigation of the false discovery rate and the misinterpretation of p-values". Royal Society Open Science. 1 (3): 140216. doi:10.1098/rsos.140216. PMC 4448847. PMID 26064558.
↑ Colquhoun, David. "The problem with p-values". Aeon. Aeon Magazine. Retrieved 11 December 2016.
↑ Colquhoun, David (2018). "The false positive risk: A proposal concerning what to do about p values". The American Statistician. 73: 192–201. arXiv:1802.04888. doi:10.1080/00031305.2018.1529622.

پیوند به بیرون

نمودار روزانه - نتایج بعید - چرا اکثر تحقیقات علمی منتشر شده احتمالاً نادرست است - نمودارهایی از مثبت و منفی کاذب در اکونومیست که در مقاله مشکلات تحقیقات علمی: چگونه علم اشتباه می‌شود؟ تحقیقات علمی جهان را تغییر داده‌است. حال باید خود تغییر کند در مورد آن بحث شده‌است. (۱۹ اکتبر ۲۰۱۳)

[4] هنگام ایجاد الگوریتم یا آزمایش تشخیص، باید تعادل بین خطرات منفی کاذب و مثبت کاذب انتخاب شود. معمولاً یک آستانه وجود دارد که قبل از اینکه الگوریتم یک مسابقه را گزارش کند، باید یک مسابقه با یک نمونه معین نزدیک شود. هرچه این آستانه بالاتر باشد، منفی‌های کاذب تر و مثبت کاذب نیز کمتر می‌شوند.

[1] False Positives and False Negatives

[DC2017-2] ۲٫۰ ^۲٫۱ Colquhoun, David (2017). "The reproducibility of research and the misinterpretation of p-values". Royal Society Open Science. 4 (12): 171085. doi:10.1098/rsos.171085. PMC 5750014. PMID 29308247.

[fn-3] Banerjee, A; Chitnis, UB; Jadhav, SL; Bhawalkar, JS; Chaudhury, S (2009). "Hypothesis testing, type I and type II errors". Ind Psychiatry J. 18 (2): 127–31. doi:10.4103/0972-6748.62274. PMC 2996198. PMID 21180491.

[DC2014-5] Colquhoun, David (2014). "An investigation of the false discovery rate and the misinterpretation of p-values". Royal Society Open Science. 1 (3): 140216. doi:10.1098/rsos.140216. PMC 4448847. PMID 26064558.

[DC2016-6] Colquhoun, David. "The problem with p-values". Aeon. Aeon Magazine. Retrieved 11 December 2016.

[DC2018-7] Colquhoun, David (2018). "The false positive risk: A proposal concerning what to do about p values". The American Statistician. 73: 192–201. arXiv:1802.04888. doi:10.1080/00031305.2018.1529622.

[۱]