۳-۶) روش تجزیه و تحلیل اطلاعات و آزمون فرضیه ها
در بررسی ارتباط بین یک متغیر وابسته با یک یا چند متغیر مستقل و با بهره گرفتن از داده های تاریخی، از سه نوع داده میتوان پارامترهای متغیر(متغیرهای) مستقل را برآورد و با ارائه مدل اقدام به پیش بینی نمود، این سه نوع داده را میتوان به شرح زیر استخراج کرد:
الف.داده های سری زمانی[۲]: دادههایی که در قالب یک (یا چند) متغیر خاص در طول زمان هستند. به عبارت دیگر سری زمانی، مجموعه ای از مشاهدات است که برحسب زمان مرتب شده باشد(آذر و مومنی،۱۳۷۷).
ب.داده های مقطعی[۳]: دادههایی هستند که در یک مقطع مشخص از زمان محاسبه و جمع آوری میشوند.
ج.داده های تلفیقی: دادههایی هستند که از ترکیب دو دسته داده های سری زمانی و مقطعی حاصل می شود. در مواردی که تعداد داده های در دسترس برای به کار بردن معادله سریهای زمانی به تنهایی کافی نباشد، برای پیش بینی و تهیه الگویی مناسب، میتوان داده های زمانی و مقطعی را با هم تلفیق نمود و الگوی مورد نظر را بر اساس مجموع داده ها برآورد نمود. در این صورت تعداد مشاهدات (N) برابر است با تعداد سالهای موردنظر (t) ضربدر تعداد داده های مقطعی در یک سال (n).
۳-۶-۱- مدل داده های سری زمانی – مقطعی (داده های ترکیبی)
در این پژوهش به منظور تخمین مدلهای رگرسیونی از داده های ترکیبی استفاده شده است. در این روش داده های سری زمانی و مقطعی با هم ترکیب میشوند و برای مواردی که نمی توان مسائل را به صورت سری زمانی یا مقطعی بررسی کرد و یا زمانی که تعداد داده ها کم است، مورد استفاده قرار میگیرد. (افلاطونی،۱۳۸۹).
مزیت استفاده از داده های ترکیبی نسبت به داده های مقطعی و سری زمانی:
۱-امکان طراحی الگوهای رفتاری پیچیده تر فراهم میگردد.
۲-داده های ترکیبی اطلاعات آگاهکننده، تنوع یا تغییر پذیری، درجات آزادی، کارایی بیشتر و نیز هم خطی کمتری بین متغیرها فراهم می کند.
۳-داده های ترکیبی یعنی داده های مرکب از یک سری زمانی از نمونه های مقطعی بالقوه، از نظر اطلاعات بسیار غنیتر از نمونه مقطعی (N) و سریهای زمانی (T) خواهند بود. اما با ترکیب این دو، تعداد داده ها به NT افزایش مییابد که این امر می تواند منجر به برآوردهای کاراتری از پارامترها گردد.
۴-داده های ترکیبی، شناسایی اثراتی (اثرات غیر قابل مشاهده) را ممکن میسازد که با بهره گرفتن از آمارهای مقطعی و سری زمانی به آسانی قابل شناسایی نیستند.
۵-داده های ترکیبی از واحدهای کوچکی گردآوری میشوند. بنابرین انحرافات ناشی از تجمع افراد یا شرکتها نیز حذف میشوند(مهرگان،۱۳۸۷).
۳-۶-۲ –روشهای تخمین
برآورد روابطی که در آن ها از داده های ترکیبی استفاده می شود، اغلب با پیچیدگیهایی مواجه است. در حالت کلی، مدل زیر نشاندهنده یک مدل با داده های ترکیبی است:
رابطه(۳-۷)
که در آن i=1,2,…,N به واحدهای مقطعی و t=1,2,…,T به زمان اشاره دارد. Yit نیز متغیر وابسته برای i امین واحد مقطعی در سال t و نیز k امین متغیر مستقل غیر تصادفی برای i امین واحد مقطعی در سال t است.
فرض می شود جمله اخلال دارای میانگین صفر() و واریانس ثابت( )است.
پارامترهای مجهول مدل هستند که واکنش متغیر وابسته نسبت به تغییرات k امین متغیر مستقل در i امین مقطع و tامین زمان را اندازه گیری میکنند. در حالت کلی فرض می شود که این ضرایب در میان همه واحدهای مقطعی و زمانی مختلف، متفاوت است. ولی در بسیاری از مطالعات پژوهشی، متغیر بودن این ضرایب هم برای تمامی مقاطع و هم برای تمامی زمانها بسیار محدود کننده است و پژوهشگر باید با توجه به ماهیت موضوع مورد مطالعه و سایر ضوابط، فرضهای مقتضی را در خصوص پارامترها تعیین نماید. این مدل را میتوان به پنج حالت زیر تقسیم کرد(Green,2003):
۱-تمامی ضرایب ثابتند و فرض می شود که جمله اخلال قادر است تمام تفاوتهای میان واحدهای مقطعی و زمانی را توضیح دهد:
رابطه(۳-۸)
۲-ضرایب مربوط به متغیرها (شیبها) ثابتند و تنها عرض از مبدأ برای مقاطع مختلف، متفاوت است.
رابطه(۳-۹)
۳-ضرایب مربوط به متغیرها (شیبها) ثابتند ولی عرض از مبدأ بین مقاطع و دوره ها متفاوت است:
رابطه(۳-۱۰)
۴-همه ضرایب برای تمامی واحدهای مقطعی متفاوتند:
رابطه(۳-۱۱)
۵-تمامی ضرایب هم نسبت به زمان و هم نسبت به واحدهای مقطعی متفاوتند:
رابطه(۳-۱۲)
در خصوص روشهای تخمین مدلهای مذکور میتوان گفت که حالتهای ۲، ۳ و ۴ بسته به ثابت یا متغیر بودن ضرایب، به مدلهای اثرات ثابت[۴] یا اثرات تصادفی[۵] تقسیم میشوند(Baltagi,2005).
۳-۶-۳ -مراحل تخمین با بهره گرفتن از داده های ترکیبی
سؤالی که اغلب در مطالعات کاربردی مطرح می شود این است که آیا شواهدی دال بر برابری عرض از مبدأها وجود دارد یا اینکه عرض از مبدأها برای مقاطع مختلف، متفاوت هستند.
فرضیه صفر برای این آزمون، برابری عرض از مبدأها برای مقاطع مختلف است. فرضیه مذکور را میتوان به عنوان یک مجموعه قیود خطی روی عرض از مبدأ در نظر گرفت و برای آزمون آن از آماره به صورت زیر استفاده نمود:
رابطه(۳-۱۳)
که در آن مجذور پسماندهای حاصل از برازش رگرسیون با عرض از مبدأهای برابر و مجذور پسماندهای حاصل از برازش رگرسیون با عرض از مبدأهای متفاوت است. در صورتی که فرض پذیرفته نشود دلیلی برای یکسان فرض نمودن عرض از مبدأ واحدهای مختلف مقطعی وجود ندارد(Baltagi,1994).
۳-۶-۴- اثرات ثابت
روش متداول در فرمولبندی مدل داده های ترکیبی، بر این فرض استوار است که اختلاف بین واحدها را میتوان به صورت تفاوت عرض از مبدأها نشان داد و بنابرین در رابطه (۳-۱۱) هر پارامتری ناشناخته است که باید برآورد شود.
با این فرض که و شامل T مشاهده برای واحد i ام باشند و بردار جزء اخلال و دارای ابعاد باشد، رابطه (۳-۱۱) را می توان به این شکل بازنویسی کرد:
رابطه(۳-۱۴)
رابطه(۳-۱۵)
۳-۶-۵- اثرات تصادفی
مدل اثر ثابت تنها در صورتی منطقی خواهد بود که اطمینان داشته باشیم اختلاف بین مقاطع را میتوان به صورت انتقال تابع رگرسیون نشان داد. در حالی که ما همیشه از این نظر مطمئن نیستیم. لذا روشهای دیگری مورد استفاده قرار می گیرند که یکی از آن ها روش اثرات تصادفی است. این روش فرض می کند که جزء ثابت مشخص کننده مقاطع مختلف، به صورت تصادفی بین این مقاطع توزیع شده است. با توجه به این مورد، مدل اثرات تصادفی به شکل زیر خواهد بود:
رابطه(۳-۱۶)
که در آن k متغیر توضیحی به اضافه یک عرض از مبدأ میباشد. مؤلفه مشخصکننده جزء تصادفی مربوط به امین واحد و در طول زمان ثابت است. در مطالعات کاربردی، میتوان را به عنوان آن دسته از ویژگیهای خاص مربوط به هر مقطع در نظر گرفت که وارد مدل نشدهاند. باید توجه داشت که در این حالت، واریانسهای مربوط به مقاطع مختلف با هم یکسان نبوده و مدل ما دچار ناهمسانی واریانس است که باید از روش حداقل مربعات تعمیم یافته استفاده شود(Baltagi,1994).
۳-۶-۶ -آزمون هاسمن