به نام خدا

نحوه بازسازی داده های اقلیمی با نرم افزار SPSS

 

        شاید شما نیز  در هنگام کار کردن با داده های اقلیمی، با مشکلاتی رو به رو بودید که یکی از مهمترین آنها کمبود یا نبود آمار و داده در یک دوره زمانی یا در یک ماه یا سال می باشد. کسانی که با مدل های مختلف اقلیمی سر و کار دارند، چنانچه می خواهند تحلیل واقع بینانه ای از شرایط اقلیمی منطقه داشته باشند و به ویژه اگر این تحلیل یک بررسی تطبیقی و مقایسه ای بین محدوده های زمانی و مکانی باشد، نیاز به این دارند که دوره آمارهای اقلیمی آنها یکسان و مشابه باشد. مثلا فرض کنید شما  می خواهید شاخص اقلیم گردشگری یا اولگی یا ترجونگ یا هر تحلیل اقلیمی را برای ماههای مختلف و برای ایستگاه های مختلف یک منطقه انجام داده و نتایج آنها را باهم مقایسه کنید. در این حالت شما باید دوره های آماری یکسانی برای همه ایستگاه ها داشته باشید تا بتوان مقایسه واقعی انجام داد. مثلا همه انها باید دارای 20 سال آمار باشد و همه آنها از 1980 تا 200 باشند (به عنوان مثال). یعنی نمی توان تعداد سالها را برای مناطق، متفاوت گرفت و حتی نمی توان دوره های زمانی را تغییر داد. باید همه یکسان باشد.

اما از آنجاییکه این آمارها توسط ابزارهای هواشناسی و نهادهای مربوطه جمع آوری می گردد، ممکن است در یک دوره زمانی خاصی به هر دلیلی آمار مربوط به آن ماه یا سال گرفته نشده یا ثبت نگردیده باشد و به اصطلاح دارای گپ باشد. حتی ممکن است یک ایستگاهی تازه تاسیس باشد و آمارهای گذشته و جدید آن موجود نباشد. بنابراین ممکن است برخی از سالها یا ماهها دارای آمار نباشند و اطلاعات آن موجود نباشد. در این حالت بهترین راه بازسازی داده هاست. یعنی:

اطلاعات و داده های ایستگاهی که مجهول هستند را از داده های ایستگاه مجاور آن که معلوم می باشد. اخذ می کنید. یعنی بر اساس داده های معلوم ایستگاه مجاور، شما عدد ایستگاه مجهول خود را به دست می آورید. روشهای بازسازی داده ها متعدد است اما یکی از ساده ترین و شاید بهترین آنها، بازسازی به روش نرم افزاری و با نرم افزار SPSS می باشد.

روش کار:

در هر روش بازسازی داده ها، اولین و مهمترین بخش کار، تعیین ایستگاهی است که مشابهت اقلیمی با ایستگاهی که می خواهید داده هایش را بازسازی کنید، داشته باشد و از طرفی داده های آن معلوم باشد و دارای گپ نباشد. تعیین این ایستگاه هم به روش نظری و هم به روش کمی امکان پذیر است. به روش نظری، این ایستگاه که داده های آن معلوم است، باید فاصله فیزیکی زیادی نداشته و در واقع ایستگاه مجاور ایستگاه مجهول باشد. از طرفی شرایط اقلیمی آن ایستگاه با ایستگاه مورد نظر تقریبا مشابهت داشته باشد. مثلا نمی توان از یک ایستگاه کوهستانی برای بازسازی داده های ایستگاه ساحلی استفاده کرد. باید هم مجاورت فیزیکی داشته و هم مشابهت اقلیمی. برای مناطقی مثل خزر که از شرایط توپوگرافیکی یکسانی برخوردار است، مجاورت فیزیکی تا حدودی کفایت می کند.

برای تعیین ایستگاه پایه راه های مختلفی است ولی خود نرم افزار می تواند از طریق تحلیل همبستگی، ایستگاه پایه را تعیین کند. در اینجا ابتدا ما آمار ایستگاهی را در مجاور ایستگاه مجهول است و خود آمار خود ایستگاه مجهول را وارد نرم افزار می کنیم و سپس برنامه میزان همبستگی بین داده های دو ایستگاه را محاسبه کرده و چنانچه همبستگی بین آنها باید از مقدار معین بود، فرایند بازسازی داده ها از این ایستگاه آغاز می شود ولی در صورت عدم همبستگی لازم، باید ایستگاه دیگر جهت محاسبه همبستگی انتخاب گردد.

حال با یک مثال روش کار را دنبال می کنیم:

در اینجا ایستگاه مورد نظر ما برای بازسازی داده ها، ایستگاه کلیماتولوژی پرند می باشد که در سواحل استان گیلان قرار دارد. امار و داده های این ایستگاه از سال 1991 تا به حال بدین صورت است:

علامت ستاره به معنای اینست که ایستگاه پرند در ان ماه ها یا سالها فاقد داده می باشد. سال 1993، 2004 تا 2006 به طور کامل فاقد آمار و چند ماه نیز در سالهای 2003 و 1994 دارای آمار نمی باشند.

حال کاری که باید انجام داد اینست که با یک ایستگاه مجاور که داده های معلوم دارد، این گپ ها را اصلاح کرد. نزدیکترین ایستگاه از نظر فیزیکی به پرند، ایستگاه سینوپتیکی رشت می باشد. حال باید دقیقا آمار و داده های ایستگاه رشت از سال 1991 تا 2006 را جمع کرده و میزان همبستگی آن با داده های پرند محاسبه شده و در صورت داشتن همبستگی، فرایند بازسازی داده ها انجام گردد. آمار و داده های ایستگاه رشت در یک فایل اکسلی به صورت زیر است:

 

پس باید آمار و داده های هر دو ایستگاه را در یک فایل Excel جمع کنیم.

 

 

 

 

 

حال نرم افزار SPSS را باز می کنیم:

آمار و داده های ایستگاه رشت را کپی کرده (فقط آمارها؛ - نام ماهها و سالها را وارد نکنید) و در محیط اصلی نرم افزار در اولین خانه paste کنید.

 حالا باید در خود نرم افزار نام ماهها را برای هر ستون بنویسید. برای این کار در بخش پایین سمت چپ، گزینه variable view را کلیک کنید.

حالا در بخش بعدی و در ستون name نام هر ماه را وارد کنید. توجه داشته باشید که نرم افزار به فرمت نام حساس است. مثلا نام تکراری قبول نکرده و اجازه فاصله دادن یا عدد خالی و ... را نمی دهد. بنابراین شما تنها نام ماه ها را وارد کنید تا در هنگام بازسازی مشخص کننده باشد. با کلیک بر روی هر خانه، نام هر ماه را بنویسید.

حال همین فرایند را برای ایستگاه مجهول پرند انجام دهید. آمار آنرا (حتی آن هایی که ندارند) کپی کرده و در صفحه اصلی نرم افزار درست در ادامه داده های رشت بدون هیچ فاصله ای paste کنید و بعد از آن درست همانند بالا برای هر ماه پرند یک نام تعیین کنید و توجه داشته باشید نام تکراری قابل قبول نیست و چون نام هر ماه را به رشت دادید، می توانید جلوی هر ماه پرند عدد 1 بنویسید تا اخطار داده نشود یا اینکه می توانید نام ماههای رشت را کامل و نام ماه های پرند را اختصاری وارد کنید.

مرحله بعدی، تعیین همبستگی بین داده های دو ایستگاه رشت و پرند می باشد.

از منوی Analyze، گزینه Correlate و  زیرگزینه bivariate   را کلیک می کنیم.

در پنجره باز شده، سمت چپ ماههایی که برای هر دو ایستگاه وارد کردیم، نشان داده شده است. هر ماهی را که می خواهیم همبستگیشان را مشخص کنیم انتخاب می کنیم و با کلیک بر روی فلش مربوطه به کادر variable اضافه می کنیم. اما از آنجاییکه هدف ما محاسبه کلی همبستگی می باشد، همه ماههای هر دو ایستگاه را انتخاب می کنیم و با کلیک روی فلش آنرا به کادر اضافه می کنیم تا همبستگی کلی بین دو ایستگاه محاسبه شود.

پس از افزودن همه ماهها با کلیک بر روی OK نتایج همبستگی در پنجره جدیدی به نمایش در می آید. در اینجا نتایج همبستگی در یک ماتریسی بزرگ به نمایش در می آید و شما می توانید نتایج همبستگی بین همه 12 ماه رشت با همه 12 ماه پرند را مقایسه کنید.

اگر چنانچه میزان همبستگی بین یک ماه با ماه دیگر از 6/0 کمتر باشد. همبستگی مثبت نبوده و نباید آمارها از این ایستگاه بازسازی شود. بالاتر از آن مناسب بوده و به معنای اینست که بازسازی داده ها امکان پذیر است.

همانطور که در تصویر بالا می بینید نقطه تلاقی ماه های رشت با پرند، عدد همبستگی را نشان می دهد. عدد همبستگی با دایره قرمز مشخص شده است. همبستگی در بین ماهها 9/0 یا 8/0 می باشد و این به معنای اینست که دو ایستگاه دارای همبستگی مناسبی بوده و می توانیم بازسازی داده های پرند از ایستگاه رشت را انجام دهیم. در تصویر زیر همبستگی بین ماههای دو ایستگاه بهتر مشخص شده است:

 

حال به سراغ بازسازی داده های می رویم:

از منوی Analyze گزینه Regression و زیرگزینه curve estimation را کلیک کنید.

 

در پنجره باز شده، در سمت چپ ماههای ایستگاه پرند و مشاهده می شوند. این بار شما باید ماههای مجهولی که می خواهید از طریق ماههای معلوم بازسازی کنید را انتخاب کنید. کادر Dependent(s) مربوط به ماههای ایستگاه وابسته یعنی پرند می باشد. در اینجا شما ماهی را که می خواهید داده آنرا بازسازی کنید، از کادر سمت چپ انتخاب و با کلیک بر روی فلش به کادر گفته شده اضافه کنید. این فرایند به صورت ماه به ماه صورت می گیرد. مثلا ماه jan1 را وارد می کنیم. سپس در کادر independent آن ماهی که قرار است ماه های مجهول از آن بازسازی شوند (یعنی ماه ایستگاه رشت) را با همان روش وارد کادر می کنیم. مثلا در اینجا ماه jan را وارد می کنیم.

 

گزینه save  بالای سمت راست صفحه را کلیک کنید و در پنجره باز شده، گزینه predicted values را تیک بزنید و OK کنید.

               

با کلیک بر روی گزینه OK فرایند بازسازی این ماه به پایان می رسد. داده های ماه ژانویه برای کل دوره آماری 16 ساله بازسازی شد یعنی اگر در هر کی از 16 سال، ماه ژانویه پرند دارای گچ داشت، می توان از طریق داده های به دست آمده بازسازی کرد.

داده های بازسازی شده درست در ادامه داده های ایستگاه های رشت و پرند که در اول کار وارد کردیم، ظاهر می شود.

 

حال می توانید از این داده ها برای ماههایی که آمار و داده نداشته، استفاده کنید.

شما می توانید فرایند بازسازی را برای سایر ماهها نیز انجام دهید. تنها کافیست در پنجره بازسازی داده ها، در بخش ماههای مجهول و معلوم، به جای ژانویه، ماه مورد نظر را وارد کنید تا فریند بازسازی برای آن ماه نیز انجام شود.

شاد و پیروز باشید

وبلاگ « بانک اشتراک گذاری جغرافیا »

www.geographybank.blogfa.com

geographybank@yahoo.com

البته فرایند بازسازی داده ها روشهای متعددی دارد و این نرم افزار یکی از این روشهای مهم بود. و از راههای دیگر نیز می توان داده ها را بازسازی کرد.