۱-۲ استنباط بیزی
در استنباط آماری دو رهیافت وجود دارد: استنباط بیزی و استنباط بسامدگرا که اغلب در اصول احتمال متفاوت هستند. استنباط بسامدگرا، احتمال را به عنوان حدی از نسبت فراوانی پیشامدها در تعداد زیادی از دنبالهها تعریف می کند و فقط برای مفهوم آزمایشاتی که تصادفی هستند، تعریف می شود. درحالیکه استنباط بیزی می تواند احتمالات را در هر موقعیتی تعیین کند، حتی زمانی که فرایند، تصادفی نباشد. در استنباط بیزی، احتمال روشی برای بیان درجهای از اعتقاد شخص یا گواه معلوم است.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
۱-۲-۱ مدل بر پایه استنباط بیزی
اساس استنباط بیزی از رابطه زیر ناشی می شود:
که در آن، توزیع پیشین بردار پارامتر قبل از مشاهده ، تابع درستنمایی تحت مدل و تابع توزیع توأم پسین بردار پارامتر است که بعد از در نظر گرفتن پیشین و داده ها، در مورد بردار پارامتر میزان عدم اطمینان را بیان می کند. و بالاخره مخرج کسر
درستنمایی کناری است.
در رابطه (۱-۲)، یک ثابت تناسب است، بنابراین:
این تناسب را میتوان به عنوان پسین توأم غیرنرمال نسبت به درستنمایی پیشین در نظر گرفت. در استنباط بیزی معمولاً، هدف خلاصه کردن توزیع پسین توأم غیرنرمال نیست بلکه هدف خلاصه کردن توزیعهای کناری پارامترها است. مجموعه کامل پارامتر را میتوان به صورت:
جدا کرد به طوریکه زیربرداری دلخواه و متمم زیربردار است، که اغلب به عنوان پارامترهای مزاحم در نظر گرفته میشوند. در چارچوب بیزی، در مسائل نظری حضور پارامترهای مزاحم در هیچ فرمولی در نظر گرفته نمی شود. پارامتر مزاحم، پارامتری است که در توزیع پسین توأم مدل وجود دارد اما پارامتر مورد نظر نیست. توزیع پسین کناری و پارامتر مورد نظر را میتوان به صورت زیر نوشت:
در استنباط بیزی، کاربر می تواند استنباطها را از توزیعهای پسین کناری ارزیابی و تعیین کند.
۱-۲-۲ مؤلفه های استنباط بیزی
مؤلفه های استنباط بیزی عبارتند از:
-
- ، مجموعه ای از توزیعهای پیشین برای بردار پارامتر است و از احتمال، به معنی عدماطمینان کمّی برای قبل از در نظر گرفتن داده ها، استفاده می کند.
-
- ، تابع درستنمایی است که در آن تمام متغیرها در یک مدل احتمالاتی کامل به هم مرتبط میشوند.
-
- ، توزیع پسین توأمی است که عدماطمینان در مورد بردار پارامتر را بعد از در نظر گرفتن پیشین و داده ها بیان می کند. اگر بردار پارامتر به یک پارامتر واحد دلخواه و پارامترهای باقیمانده که پارامتر مزاحم در نظر گرفته میشوند، تقسیم شود آنگاه ، توزیع پسین کناری است.
۱-۲-۳ برازش مدل
در استنباط بیزی متداولترین روش ارزیابی مدل آماری برآورد شده، معیار اطلاع انحراف است. اسپیگلهالتر و همکارن (۲۰۰۲) معیار اطلاع انحراف را برای مقایسه مدل بیزی پیشنهاد دادند. این معیار بر پایه انحراف زیر است:
به طوری که، فقط تابعی از داده ها است. بر پایه انحراف، معیار اطلاع انحراف عبارت است از:
بخش اول این رابطه که به عنوان امیدریاضی پسین انحراف تعریف می شود، به عنوان شاخص برازش بیزی مدل مورد استفاده قرار میگیرد، بنابراین:
مدلی که داده ها را بهتر برازش میدهد، مقدار لگاریتم درستنمایی بزرگتر و بنابراین مقدار کوچکتری دارد. بخش دوم که به میزان پیچیدگی مدل مربوط است، به عنوان اختلاف بین میانگین پسین انحراف و انحراف میانگین پسین پارامترها برای شاخص پیچیدگی مدل به کار میرود:
که در آن ، برآوردگر بیزی پارامتر است. توجه کنید که معیار اطلاع انحراف را میتوان به دو شکل زیر بیان کرد:
و
معیار اطلاع انحراف تعمیمی از معیار اطلاع آکاییک () و معیار اطلاع بیزی () است. همانند معیار اطلاع آکاییک و معیار اطلاع بیزی وقتی حجم نمونه بزرگ باشد معیار اطلاع انحراف یک تقریب مجانبی است. مدلهایی که معیار اطلاع انحراف کمتری دارند، ترجیح داده میشوند.
۱-۳ مفصل
زمانیکه فرشه به دنبال پیدا کردن جواب سؤالی در مورد رابطه بین یک تابع احتمال چندبعدی و حاشیههایش با کمترین بعد بود، مفهوم مفصل در سال ۱۹۵۹ توسط اسکلار مطرح شد. در ابتدا، مفصلها عمدتاً برای بسط نظریه فضاهای متریک احتمالی به کار میرفت، اما بعداً، برای تعریف معیار وابستگی ناپارامتری بین متغیرهای تصادفی مورد توجه قرار گرفتند و سپس، نقش مهمی را در احتمال و آمار ریاضی ایفا کردند.
در طی زمانی طولانی، آماردانها به رابطه بین یک تابع توزیع چندمتغیری و حاشیههایش با کمترین بعد (تک متغیره یا ابعاد بزرگتر)، توجه داشته اند. در دهه پنجاه، فرشه به این موضوع علاقه نشان داد و توابع توزیع دومتغیره و سهمتغیره را به شرط حاشیههای تکمتغیره بررسی کرد. این مسئله برای حالت حاشیههای تک متغیره، با ایجاد رده جدیدی از توابع که مفصل نامیده میشوند، توسط اسکلار در سال ۱۹۵۹ پاسخ داده شد. این توابع جدید به از توابع توزیع دومتغیره محدود میشوند درحالیکه حاشیهها توزیع یکنواخت روی هستند. به طورخلاصه اسکلار نشان داد که اگر یک تابع توزیع دومتغیره با حاشیههای و باشد، آنگاه مفصل ایی وجود دارد به طوریکه .
۱-۳-۱ مفهوم مفصل
تعریف۱-۵ (مفصل): یک مفصل بعدی است به طوری که
-
- به ازای هر در ، .
-
- به ازای هر در ، .
-
- به ازای هر ، حجم B نامنفی است:
به بیان سادهتر تابع مفصل عبارت است از: توزیع چندمتغیرهای که توزیعهای کناری آن به طور یکنواخت روی توزیع شده اند.
۱-۳-۲ قضیه اسکلار
قضیه۱-۱ (قضیه اسکلار): فرض کنید بردار تصادفی بعدی با تحقق و به ازای ، توابع توزیع کناری و تابع توزیع توأم باشد آنگاه برای Y پیوسته یا گسسته داریم:
که در آن C به عنوان تابع مفصل، معلوم است.
در حالت پیوسته میتوان چگالی چندمتغیره را با مشتقگیری از دو طرف معادله قبل به صورت زیر تعیین کرد:
۱-۳-۳ حالت پیوسته
برای دو متغیر پیوسته و داریم:
اهمیت مفصلها با بهره گرفتن از قضیه اسکلار، قابل توجیه است. این قضیه بیان می کند، مفصل یکتای وجود دارد به طوری که را از طریق
به و مربوط می کند. بنابراین اطلاعات موجود در توزیع توأم در توزیعهای کناری و تابع مفصل که ساختار وابستگی بین و را نشان میدهد، تقسیم شده است. بهعبارتدیگر، به ازای هر تابع مفصل و هر تابع توزیع تکمتغیره و ، تابع ، همان تابع توزیع دومتغیره تعیین شده در (۱-۴) است. تبعاً، یک ویژگی مؤثر رده مفصل این است که، زمانیکه مفصل هیچ وابستگی با رفتار کناری ندارد حذف اثر کناری از طریق آن به طور مؤثری به مدلسازی و ساختار وابستگی قابل فهم، کمک می کند. این برای کاربردهای تجربی مفید است زیرا اگر توزیع دومتغیره معلوم نباشد اما حاشیههای پیوسته تک متغیره و معلوم باشند آنگاه انتخاب مناسب مفصل در (۱-۴)، نمایشی از یک توزیع دومتغیره نامعلوم فراهم می کند. علاوهبراین، مفصل را میتوان بر حسب برداری از پارامترها که درجه وابستگی بین کناریهای تکمتغیره را میگیرد، مشخص کرد.
در زیر خانوادهای از مدلهای مفصل دومتغیره که تعدادی از ویژگیهای مطلوب را داراست، ارائه شده است: