معرفی تجزيه و تحلیل (آناليز) واریانس و فرمولهاي آن

از جمله سؤالات متداول که که با اجرای یک طرح پژوهشی مایل هستیم به آن پاسخ داده شود، وجود یا عدم وجود تفاوت معنی دار بین دو یا چند سطح متغیر پاسخ می باشد. در حالتی که هدف مقایسه میانگین در دو گروه باشد مانند مقایسه ی وضعیت بهبود بیماران در دو گروه کسانی که از دارونما استفاده می کنند و کسانی که داروی خاصی را دریافت می کنند و یا مقایسه کشش نوعی سیمان که با دو فرمول مختلف بدست آمده است، آزمایش دارای یک عامل بوده که در دو سطح مختلف اندازه گیری می شود و با توجه به شرایط موجود به کمک آزمون های z نرمال یا t استودنت قابل بررسی می باشد.

اما بسیاری از این نوع آزمایش ها بیش از دو سطح یک عامل را شامل می شوند، در چنین حالتی یک ابزار مقایسه سطوح (تیمارهای) یک عامل استفاده از تحلیل واریانس یا ANOVA می باشد. برای مثال فرض کنید یک مهندس برای بهبود محصول مایل است مقاومت کششی یک نخ مصنوعی جدید را حداکثر نماید. از طرفی وی می داند که درصد پنبه ی نخ در میزان مقاومت آن مؤثراست و از آنجایی که میزان پنبه در نخ بایستی بین 10 تا 40 درصد باشد، محقق در هریک ازسطوح 15 ،‌20‌، 25، 30 و 35 درصد پنبه ، میزان مقاومت کششی نخ را برای 5 مشاهده اندازه گیری می کند. حال برای بررسی درصدهای مختلف پنبه بایستی تفاوت های بین میانگین مقاومت ها را برای هر پنج سطح عامل درصد پنبه، آزمون کنیم.

 ممکن تصور شود که با انجام آزمون tبرای تمام جفت میانگین های ممکن این مسئله قابل حل باشد، در حالی که این روش نمی تواند یک راه حل صحیح باشد زیرا منجر به افزایش خطا خواهد شد. فرض کنید در مثال بالابخواهیم تمام 10 جفت آزمون ممکن را برای مقایسه میانگین های دوبه دو داشته باشیم، به این ترتیب با فرض مستقل بودن تمام این آزمون ها و این که احتمال این که فرض صفر (برابری میانگین 5 گروه ) به درستی پذیرفته شود برابر  باشد،حال آنکه احتمال پذیرش صحیح فرض صفر مبنی بر برابری همزمان تمام جفت میانگین ها برابر  خواهد بود و خطای نوع اول در این حالت برابر 0.4 می شود که بسیار زیاد است .

 

تحلیل واریانس : فرض کنید می خواهیم چند تیمار یا چند سطح مختلف یک عامل را مقایسه نمائیم. پاسخ مشاهده شده از هر تیمار یک متغیر تصادفی می باشد.  مشاهده ی j ام از تیمار i ام است که j=1,2,…,n و i=1,2,…,a تغییر می کند. در حالت کلی برای هر تیمار n مشاهده جمع آوری می شود. مشاهدات به کمک مدل آماری خطی  قابل توصیف است . در این مدل  ، میانگین کل ، پارامتر مشترک برای تمام تیمارها،  اثر تیمار i ام بر مقدار پاسخ و  مؤلفه های خطای تصادفی مدل می باشند که مستقل بوده و دارای توزیع نرمال با میانگین صفر و واریانس  است.

 فرض کنید  مجموع مشاهدات تیمار i ام و  میانگین مشاهدات تیمار i ام را نشان دهد. به طور مشابه  را مجموع کل مشاهدات و  را میانگین کل مشاهدات می نامیم.  

 ما می خواهیم برابری میانگین تیمارها را آزمون کنیم یعنی،  . از طرفی با توجه به آن که میانگین تیمار i ام ،  است ، اگر فرض صفر درست باشد همه ی تیمارها میانگین مشترک  را خواهند داشت بنابراین فرض صفر را می توان به صورت  بیان نمود که در برابر ، حداقل برا ی یک i    ، آزمون می شود. 

 فرمولهاي آناليز واريانس

 فرمول توزيع فيشر در تحليل واريانس