X بستن تبلیغات
X بستن تبلیغات
header
متن مورد نظر

آشنایی با نرم‌‌افزارهای آماری

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

امروزه با شناخت بیشتر علم آمار و جایگاه آن در جامعه، آمار در سطح وسیعی توسط محققین رشته‌‌های اقتصادی، تجاری، کشاورزی و ….. بکار گرفته می‌‌شود.در این راستا کامپیوتر در جهت تسریع محاسبات آماری با حجم وسیعی از اطلاعات در خدمت آمار قرار می‌‌گیرد. لذا تحلیل‌‌گران با فراگیری نرم‌‌افزارهای آماری، محاسبات و روشهای پیچیده آماری را توسط کامپیوتر انجام می‌‌دهند. و بدین ترتیب، فرصت بیشتری را صرف تجزیه و تحلیل نهایی اطلاعات می‌‌نمایند.

تاکنون نرم‌‌افزارهای آماری QUATTRO PRO, SPSS ,  STATGRAPHICS و …. و اکنون SAS با قابلیتهای بیشتر و مطلوبتر سهم عمده‌‌ای درجهت تسریع عملیات آماری دارد.به جهت کاملتر بودن نرم‌‌افزار آماری (Statistical Analysis system) SAS نسبت به سایر نرم‌‌افزارهایی که تاکنون عرضه‌ شده‌‌اند، کتبی تحت عنوان آشنایی با نرم‌‌افزار آماری SAS تهیه و چاپ شده است.

 

(آشنایی با نرم‌‌افزارهای آماری)

امروزه با شناخت بیشتر علم آمار و جایگاه آن در جامعه، آمار در سطح وسیعی توسط محققین رشته‌‌های اقتصادی، تجاری، کشاورزی و ….. بکار گرفته می‌‌شود.در این راستا کامپیوتر در جهت تسریع محاسبات آماری با حجم وسیعی از اطلاعات در خدمت آمار قرار می‌‌گیرد. لذا تحلیل‌‌گران با فراگیری نرم‌‌افزارهای آماری، محاسبات و روشهای پیچیده آماری را توسط کامپیوتر انجام می‌‌دهند. و بدین ترتیب، فرصت بیشتری را صرف تجزیه و تحلیل نهایی اطلاعات می‌‌نمایند.

تاکنون نرم‌‌افزارهای آماری QUATTRO PRO, SPSS ,  STATGRAPHICS و …. و اکنون SAS با قابلیتهای بیشتر و مطلوبتر سهم عمده‌‌ای درجهت تسریع عملیات آماری دارد.

به جهت کاملتر بودن نرم‌‌افزار آماری (Statistical Analysis system) SAS نسبت به سایر نرم‌‌افزارهایی که تاکنون عرضه‌ شده‌‌اند، کتبی تحت عنوان آشنایی با نرم‌‌افزار آماری SAS تهیه و چاپ شده است.

 


(آشنایی با سامانه SAS تحت ویندوز )

(پنجره AWS (Application Work Space) )

 

هنگامی که روی نشانه SAS دوبار کلیک کنید، بر روی صفحه ظاهر می‌‌شود. پنجره AWS ( یا فضای کار کاربردی) پنجره اصلی SAS می‌‌باشد که پنجره‌‌های دیگر SAS از طریق آن قابل دسترسی است. بخش‌‌های اصلی پنجره AWS به شرح زیر است.

 

(نوار منو )

منوهای موجود در پنجره فعال SAS را نشان می‌‌دهد. زمانی که پنجره فعال را عوض می‌‌کنید. نوار منو نیز تغییر می‌‌کند. بعلاوه زمانی که کلید سمت راست ماوس را در داخل پنجره فعال فشار می‌‌دهید، منوهای Pop-Up ظاهر می‌‌شوند. محتوای این منوها مشابه منوهای قبلی و وابسته به پنجره فعال است.

 

(نوار دستور )

این امکان را به کاربر می‌‌دهد تا دستورهای مدیریت نمایش را وارد کند. نوار دستور، فهرستی از دستورهای وارد شده را نگهداری می‌‌کند. برای اجرای مجدد دستوری که قبلاً وارد کرده‌‌اید، دستور مورد نظر را از فهرست انتخاب کرده سپس روی کلید «ü» کلیک کنید.

برای رفتن به نوار دستور علاوه بر استفاده از ماوس، از کلید F11 نیز می‌‌توانید استفاده کنید.

 

(میله‌‌ ابزار )

امکان دسترسی و اجرای دستورهایی را که زیاد با آنها سروکار دارید فراهم می‌‌کند. هر یک از این دستورها دارای نشانه‌‌ای خاص روی میله ابزار بوده و برای اجرای آنها کافی است اشاره‌‌گر ماوس را روی نشانه مورد نظر برده سپس کلید سمت چپ ماوس را فشار دهید.

 

(خط وضعیت )

شامل یک ناحیه پیغام و شاخه جاری سامانه SAS می‌‌باشد. ناحیه پیغام متن راهنمایی منوها و ابزار را نمایش  می‌‌دهد. برای تغیر شاخه جاری، روی ناحیه دوم دو بار کلیک کرده و شاخه مورد نظر را از صفحه باز شده انتخاب نمایید.

 


(پنجره‌‌های اصلی SAS)

زمانی که SAS را فراخوانی می‌‌کنید، پنج پنجره LOG، PGM،OUTPUT، EXPLORER، RESULTS را مشاهده می‌‌کنید. اینها پنجره‌‌های اصلی مدیریت نمایش هستند.

به سه روش می‌‌توانید دستورها را اجرا کنید.

– از منوها استفاده کنید.

– دستور را در خط دستور یا نوار دستور وارد کنید.

– از کلیدهای عملگر استفاده کنید.

 

(پنجره (PGM) PROGM EDITOR)

ویرایشگری است که می‌‌توانید برنامه‌‌های SAS را درآن وارد کرده، ویرایش و اجرا کنید.

 

(پنجره LOG)

پیغام‌‌هایی را درباره SAS و برنامه‌‌ای که درحال اجرا شدن است، نمایش می‌‌دهد. احتمالاً متوجه شده‌‌اید که در هر زمان تنها چند خط در پنجره LOG قابل مشاهده می‌‌باشد. شما می‌‌توانید پنجره فعال را آن قدر بزرگ کنید تا تمام صفحه را دربر گیرد.

 

(پنجره OUTPUT)

زمانی که برنامه‌‌ای را اجرا می‌‌کنید که خروجی تولید می‌‌کند، به طور خودکار به پنجره OUTPUT منتقل می‌‌شوید. این پنجره‌‌ شما را قادر می‌‌سازد تا خروجی دستورالعمل‌‌های برنامه خود را ببینید.

 

(پنجره EXPLORER)

در این پنجره می‌‌توانید فایلهای SAS را مشاهده و مدیریت کنید و نیز میان‌‌برهایی برای فایلهای غیر SAS ایجاد نمایید. از این پنجره برای ایجاد فایلها و کتابخانه‌‌های جدید SAS، باز کردن فایلهای SAS، و انجام بیشتر کارهای مدیریت پرونده، از قبیل انتقال، کپی، و حذف فایلها استفاده کنید. می‌‌توانید نمایش یا عدم نمایش ساختار درختی را برای این پنجره انتخاب کنید.

 

(پنجره RESULTS)

این پنجره شما را در هدایت و مدیریت خروجیهای حاصل از برنامه‌‌هایی که اجرا کرده‌‌اید، کمک می‌‌کند. شما می‌‌توانید تک ‌‌تک اقلام خروجی را ببینید، ذخیره کنید، و چاپ نمایید. به طور پیش فرض این پنجره در پشت پنجره EXPLORER قرار گرفته است.

 

(پنجره (MANAGER   MGR ) OUTPUT MANAGER )

برای دیدن لیستی از مندرجات پنجره OUTPUT می‌‌توانید به آخرین پنجره اصلی SAS یعنی Output Manager بروید. از طریق پنجره MGR، می‌‌توانید خروجی را ببینید و آن را ویرایش، حذف، ذخیره و یا چاپ کنید.

 

برنامه SAS

عبارتها در یک برنامه SAS در دو گام بکار می‌‌روند: گام DATA و گام PROC معمولاً گام DATA، مجموعه داده‌‌های SAS ایجاد می‌‌کند و گام PROC، مجموعه داده‌‌های SAS، که فایل ویژه SAS برای ساماندهی و ذخیره داده‌‌ها است، را پردازش می‌‌نماید.

 

(گام DATA)

قبل از اینکه بتوانیم نرم‌‌افزار SAS را بمنظور مهیا ساختن داده‌‌ها برای تحلیل با بکارگیری روش‌‌های SAS بکار بریم، نخست باید داده‌‌ها را وارد یک مجموعه داده‌‌های SAS کنیم.

وقتی که داده‌‌ها دریک مجموعه داده‌‌های SAS است، می‌‌توان مجموعه داده‌‌ها را با سایر مجموعه داده‌‌های SAS ترکیب کرده و هر روش آماری موجود در سامانه SAS را درباره آنها بکار گرفت.

 

(عبارتهایی که در گام DATA به کار می‌‌روند: )

(عبارت DO)

عبارت DO عبارتهای بعد از DO را اجرا می‌‌کند تا اینکه عبارت END ظاهر شود.

عبارتهای بین DO و END را گروه DO می‌‌نامند.

 

(- عبارت DO ی ساده )

عبارت‌‌ DO ی ساده غالباً با عبارتهای IF-THEN/ELSE برای اجرای گروهی از عبارتها بسته به اینکه شرط IF درست باشد یا غلط، بکار می‌‌رود.

 

(- عبارت DO ی مکرر )

اجرای مکرر گروه DO را می‌‌توان با متغیر شاخص در عبارت DO ی مشخص کرد. عبارت DO مکرر بر اساس مقدار متغیر شاخص موجب تکرار اجرای عبارتهای بین DO و END می‌‌شود.

 

(عبارت OUTPUT)

عبارت OUTPUT از SAS می‌‌خواهد  مشاهده جاری را در مجموعه داده‌‌هایی که در حال ایجاد شدن است، بنویسد. شکل عمومی عبارت OUTPUT به صورت زیر است

…. [نام مجموعه داده‌‌ها] OUTPUT

 

(عبارت SET)

عبارت SET از سامانه SAS می‌‌خواهد که مشاهدات را از یک یا چند مجموعه داده‌‌های SAS بخواند. عبارت SET برای خواندن زیر مجموعه یا در آمیختن مشاهدات از چند مجموعه داده‌‌های موجود SAS در یک مجموعه داده‌‌های جدید بکار می‌‌رود.

 

(گام PROC)

گام PROC از SAS می‌‌خواهد  یک روش را از مخزن برنامه‌‌های پیش نوشته صدا کرده و آنرا روی مجموعه داده‌‌های ورودی SAS اجرا کند. گام PROC با عبارت شروع می‌‌شود. سایر عبارتهای گام PROC اطلاعات بیشتری درباره نتیجه تحلیل داده‌‌ها ارائه می‌‌کنند. عبارتهای موجود در هر گام PROC بسته به روشی است که صدا زده می‌‌شود.

 

(عبارتهایی که در گام PROC بکار می‌‌روند)

عبارتهایی که در گام PROC ظاهر شوند ویژگی‌‌های متغیرها و اطلاعاتی درباره روش‌‌های تحلیل را ارائه می‌‌کنند.

 

(عبارت BY)

عبارت BY در گام PROC برای تحلیل داده‌‌های مربوط به گروه‌‌ها بکار می‌‌رود. عبارت By همواره با Proc Sort  برای تعریف ترتیبی که مجموعه داده‌‌ها باید مرتب شوند استفاده می‌‌شود.

شکل عمومی عبارت BY به صورت زیر است.

; متغیرها BY [DESCENDING]

که:

متغیرها، نام متغیر و یا متغیرهایی است که گروه‌‌ها را تعریف می‌‌کند. روش‌‌های SAS داده‌‌ها را در گروه‌‌هایی که تعریف شده‌‌اند. به طور جداگانه پردازش می‌‌کند.

 

(عبارت CLASS)

عبارت CLASS یا چندین روش SAS برای  مشخص نمودن متغیرهای رده‌‌بندی بکار می‌‌رود.

شکل عمومی عبارت CLASS به صورت زیر است.

;متغیرها         CLASS 

که:

متغیرها، نام متغیرهای رده‌‌بندی است که در تحلیل وارد می‌‌شوند.

 

(عبارت LABEL)

عبارت LABEL در گام PROC برای دادن برچسب به متغیرها بکار می‌‌رود. اکثر روش‌‌های SAS برای نوشتن نتایج تحلیل‌‌ها برچسب متغیرها را بکار می‌‌برند.

 

(عبارت OUTPUT)

در بسیاری از روش‌‌های SAS عبارت OUTPUT برای ایجاد مجموعه‌‌ داده‌‌های SAS خروجی بکار می‌‌رود. اگرچه شکل یک عبارت OUTPUT ممکن است در روش‌‌های گوناگون متفاوت باشد ولی شکل عمومی آن به صورت زیر است.

؛….. [نام = واژه کلیدی] [نام مجموعه داده‌‌های    OUT=SAS ] OUTPUT   

که:

نام مجموعه داده‌‌های SAS، نامی برای مجموعه داده‌‌های جدید SAS که به وسیله روش تحلیل داده‌‌ها ایجاد شده است، مشخص می‌‌کند.

نام = واژه کلیدی به متغیرهای خروجی مجموعه داده‌‌های ایجاد شده، نامی منتسب می‌‌کند. واژه‌‌های کلیدی معمولاً آماره‌‌های توصیفی هستند.

 

(عبارت QUIT)

عبارت QUIT روش های متقابل را خاتمه می‌‌دهد. روش‌‌های متقابل در SAS روش‌‌هایی هستند که با عبارت RUN خاتمه نیافته و عبارتهای معتبر در این روش‌‌ها قابل اجرا هستند. هنگامی که عبارت QUIT ( و یا عبارتهای DATA و PROC ) اجرا شود، روش متقابل کامل شده تلقی می‌‌گردد و خروجی روش نمایش داده می‌‌شود.

 

(عبارت VAR)

در بسیاری از روش‌‌های SAS عبارت VAR (خلاصه VARIABLES) برای مشخص کردن متغیرهایی که باید وارد تحلیل شوند، بکار می‌‌رود.

شکل عمومی عبارت VAR به صورت زیر است.

;متغیرها      VAR 

که:

متغیرها، نام متغیرهایی است که می‌‌خواهیم با روش موردنظر تحلیل شوند.

 

(عبارت WEIGHT)

در روش‌‌های SAS عبارت WEIGHT برای مشخص کردن متغیری که مقادیرش وزن نسبی مشاهدات هستند، بکار می‌‌رود.

شکل عمومی عبارت WEIGHT به صورت زیر است.

;  متغیر                  WEIGHT 

که:

متغیر، نام متغیری است که مقادیرش وزن مشاهدات هستند.

 

(عملکردهای محاسباتی در SAS)

در SAS برای جمع از علامت +، تفریق از علامت- تقسیم از علامت / ضرب از * و برای توان از ** استفاده می‌‌شود.

 

(توابع تعریف شده در SAS)

توابع کتابخانه‌‌ای در SAS عبارتست از:

۱) تابع  (   ) SQRT که جذر را برمی‌‌گرداند ( داخل پرانتز نام متغیر مورد نظر را بنویسید)

۲) تابع (   ) ABS قدر مطلق را برمی‌‌گرداند

۳) تابع (    ) LOG لگاریتم طبیعی را برمی‌‌گرداند

۴) تابع (   ) EXP فرم نمایی را برمی‌‌گرداند

۴) توابع مثلثاتی (  ) sin، (  ) cos، (   ) tg، (  ) cotg

۵) تابع ( …. و …. و….و) sum مجموع چند متغیر را برمی‌‌گرداند

۶)تابع ( …. و…..و ….. و ) mean میانگین چند متغیر را برمی‌‌گرداند

۷) تابع ((l,n poisson مقادیر توزیع پواسن تابع probbnml (p,n,m) مقادیر توزیع دو جمله‌‌ای، تابع probnorm(x) مقادیر توزیع نرمال و تابع probt(x,df) مقادیر توزیع t را حساب می‌‌کند.

۸) تابع tinvl(p,df) چند کهای توزیع t را محاسبه می‌‌کند.

 

(رویه proc freq)

یکی از روشهای خلاصه نمودن اطلاعات ترسیم جداول فراوانی و یا جداول توافقی می‌‌باشد. SAS به کمک رویه فوق اقدام به ترسیم جداول فراوانی به محاسبه درصدهای نسبی، تجمعی،… می‌‌نماید. رویه freq بشکل‌‌های زیر بکار می‌‌رود.

proc freq  ;

شکل کلی دستور:

proc freq ORDER = internal ;

رویه فوق پس از مرتب کردن داده‌‌ها اطلاعات را وارد جدول فراوانی می‌‌کند.

proc freq ORDER = DATA ;

رویه فوق به همان شکل که داده‌‌ها وارد شده‌‌اند، اطلاعات را وارد جدول فراوانی می‌‌کند.

proc ferq ORDER = FREQ ;

این رویه ستون فراوانی را بصورت نزولی مرتب می‌‌‌کند.

جهت معرفی لیست متغیرهایی که برای آنها جدول فراوانی رسم می‌‌شود از زیر رویه و نام متغیرها TABLES به دنبال رویه freq استفاده می‌‌شود.

 


(فصل چهارم)

(کاربرد نرم‌‌افزار SAS در مدلهای خطی لگاریتم خطی لجستیک )

(- آشنایی با زیر برنامه CATMOD    (categorical data moding))

در نرم‌‌افزار  SAS زیر برنامه CATMOD این قابلیت مهم را دارا می‌‌باشد که جداول دو بعدی ( داده‌‌های دسته‌‌بندی شده) را مورد تجزیه و تحلیل قرار دهد، برای برازش مدلهای خطی، لگاریتم خطی و لجستیک بکار می‌‌رود.

سطرهای این جدول دو بعدی جوامع ( نمونه‌‌ها) را تشکیل می‌‌دهند که بر اساس یک یا چند متغیر مستقلند و ستونهای جدول مطابق با پاسخهای (response) مشاهده شده و براساس یک یا چند متغیر وابسته‌‌اند. فراوانی خانه (i,j) برابر تعداد مشاهدات جامعه li م است که پاسخ lj م را داشته‌‌اند. CATMOD دو نوع برآورد دارد.

۱- برآورد ML که تنها برای مدلهای لگاریتم خطی و لجستیک است.

۲- روش حداقل مربعات که مجموع مربعات خطا را در مدل حداقل می‌‌کند.

فرض می‌‌شود توزیع فراوانیهای جدول چند جمله‌‌ای می‌‌باشد و مطابق با طرح نمونه‌‌گیری از هر جامعه یک نمونه تصادفی گرفته شده است. طرح جدول توافقی به شکل زیر می‌‌باشد:

RESPONSE

 POPULATION                                                  

 

r

۲

۱

 

n1

n1r

….

n12

n11

۱

n2

n2r

n21

۲

ns

nsr

ns1

S

 

(پارامترهایی که توسط CATMOD محاسبه می‌‌شود عبارتند از: )

– ماتریس کواریانس

– لوجیتهای تجمعی یا تعمیم یافته

– میانگین حاشیه‌‌ای یا احتمالات آن

– فراوانی یا احتمالات خانه‌‌های پیش‌‌بینی شده

– توابع پاسخ پیش‌‌بینی شده

 

(آزمون فرضهایی که با محاسبات فوق امکان‌‌پذیرمی‌‌باشد عبارتند از: )

– استقلال

– نیکویی برازش

– فرضهای خطی

– همگنی حاشیه‌‌ای

– وجود شیب و عرض از مبداء

– وجود اثرات اصلی و متقابل

 

(مشخص کردن اثرات )

نحوه معرفی اثرات به نرم‌‌افزار SAS عبارتند از:

* اثرات اصلی A   B  C

* اثرات متقابل که با * به هم ربط داده می‌‌شوند B*C  A*C  A*B  A*B*C

* اثر آشیانه‌‌ای اثر اصلی یا متقابل (CD)   A*B  A*B (C*D)    C(A*B)    B(A)

البته متغیرهای چندگانه واقع در خانه پرانتزها حتی وقتی که * وجود نداشته باشد، اثر حاصلضربی آنها در نظر گرفته می‌‌شود.

 

(علائم BAR)

مشخصه‌‌های اثرات را می‌‌توان با استفاده از علائم bar کوتاهتر نمود. برای مثال به دو روش نوشتن دستور model توجه کنید:

PROC CATMOD ;

MODEL Y=A B C  A*B  A*C  B*C A*B*C  ;

و

PROC CATMOD  ;

MODEL    Y= A| B| C ;

چنانچه ملاحظه می‌‌فرمایید دو دستور فوق معادلند، ولی روش bar| برای نوشتن ساده‌‌تر می‌‌باشد.

 

(فهرست دستورات زیر برنامه CATMOD )

این دستور الزامی است;  PROC CATMOD options

قبل از دستورالعمل model قرار می‌‌گیرد. DIRECT variabls ;

دستورالعمل الزامی MODEL response-effect=desigh-

effects/options ;

قبل از دستور MODEL قابل اجرا نیست CONTRAST “label” row-description , .. ;

دستورات زیر به جز run و quit در هر جای برنامه قابل استفاده می‌‌باشد:

By   vaviabbs;

FACTORS fuctor – description , .. / option;

Lo GLIN effects;

MODEL response-effect=design-effect/options;

POPVLATION Variubles;

REPEATED  Factor-desrription,…loptions;

RESPONSE Function / options;

WEI GHT  Variables;

RVN;

QVIT;

دستور RUN نیز جهت اجرای برنامه استفاده می‌‌شود. اولین دستور run موجب اجرای همه دستورات قبل از خودش می‌‌شود. اگر دوبار از دستورات run استفاده کنید run دوم دستوراتی را که بین دو run می‌‌باشد، اجرا می‌‌کند. اگر بیش از یک دستور contrast بین دو run باشد تمام آنها اجرا می‌‌شوند. بقیه دستورات فقط یکبار بین دو run قابل اجرا است مثلاً اگر دو دستور loglin بین دو run باشد اولی نادیده گرفته می‌‌شود.

دستورات proc catmod و model الزامی می‌‌باشند. دستورات repeated و factors فقط یکی بین دو run قابل قبول است. دستور quit هر دستوری را که پردازش نشده باشد اجرا می‌‌کند و علمیات تمام می‌‌شود.

 

( طریقه وارد کردن داده‌‌‌‌ها )

به ۳ طریق می‌‌توان داده‌‌های جداول توافقی را به SAS معرفی نمود:

 

واردکردن سطری داده‌‌ها

(الف- سطرها و ستونهای جدول را کدگذاری کنید. )

مثال:

A=2

A=1

 

۱

۲

B=1

۰

۳

B=2

 

(ب- در این مرحله داده‌‌ها را طبق مثال زیر وارد کنید.)

DATA ;

INPUT A  B ;

CARDS ;

۱           1

۱           1

۲           1

۱           2

۱           2

۱           2

PROC CATMOD ;

MODEL  A=B  ;

 

(شمارش فراوانیها )

گاهی برای سهولت کار از روش زیر استفاده می‌‌کنند.

جدول مثال قبل (روش وارد کردن سطری داده‌‌ها) را در نظر بگیرید.

۱- سطرها و ستونهای جدول را به همان شکل ( مثال قبل) کد گذاری کنید.

۲- فراوانی هر خانه را به شکل زیر جلوی آن تایپ کنید.

INPVT       A     B  COUNT  ;

CARDS ;

۱         1            2

۱         2            3

۲         1            1

PROC CATMOD   ;

WEIGHT   COUNT ;

MODEL A=B ;

ارسال نظر