دسته : -مبانی و پیشینه نظری
فرمت فایل : word
حجم فایل : 334 KB
تعداد صفحات : 67
بازدیدها : 438
برچسبها : پروژه تحقیق مبانی نظری
مبلغ : 13500 تومان
خرید این فایلمبانی نظری اعتبار و هنجاریابی آزمون روانشناسی
در 67 صفحه ورد قابل ویرایش با فرمت docx
توضیحات: فصل دوم پایان نامه (پیشینه و مبانی نظری پژوهش)
همراه با منبع نویسی درون متنی به شیوه APA جهت استفاده فصل دو پایان نامه
توضیحات نظری کامل در مورد متغیر
پیشینه داخلی و خارجی در مورد متغیر مربوطه و متغیرهای مشابه
رفرنس نویسی و پاورقی دقیق و مناسب
منبع : فارسی و انگلیسی دارد (به شیوه APA)
نوع فایل: WORD و قابل ویرایش با فرمت docx
قسمتهایی از متن مبانی نظری و پیشینه
مبانی نظری اعتبار و هنجاریابی آزمون
هر رشتهی علمی با یک سری نظریهها مواجه است که زیربنا و بنیاد آن رشته را تشکیل میدهد و شالودهی دستاوردها و یافتههای علمی آن شاخه از علوم محسوب میشود. از زمان پیدایش علم روان سنجی تغییرات بنیادی زیادی در نظریه های آن صورت گرفته است و این سیر تحولی به گونه مستمر ادامه داشته است.این نظریهها دارای انواع و مدلهایی هستند و هر کدام معطوف به بعد خاصی از اندازهگیری میباشند. یک نظریه یا مدل اندازهگیری خوب در یک آزمون سنجش توانایی با مشخص کردن رابطه ی بین سوالات آزمون و سطح توانایی، چارچوب مرجعی جهت طراحی آزمون مناسب و حل مشکلات عملی مربوط به آن فراهم میسازد. بدیهی است که از یک نظریه و مدل مناسب، انتظار میرود که بتواند دقت قابلقبولی در اندازهگیری پدیده مورد نظر داشته باشد.
نظریههای آماری نمرات اندازهگیری به تدریج در طول صد سال اخیر توسعه یافتهاند. در سال 1904، چارلز اسپیرمن[1] مبنای نظری اساسی برای الگوی نمره واقعی ارائه داد. در چند دهه پس از آن، تحولات بسیاری شکل گرفت. گالیکسن[2](1950)، تمام این تحولات را در یک سیستم واحد منسجم خلاصه کرد. این سیستم متشکل از قضایا و معادلات آماری به عنوان نظریه کلاسیک اندازهگیری شناخته شده است. فردریک لرد[3](1952) و جرج راش[4](1960)آنچه را که در حال حاضر به عنوان نظریه پرسش – پاسخ شناخته میشود را به طور مستقل گسترش دادند. در سال 1963، لی کرونباخ[5](کرونباخ، راجاراتنام[6] و گلیسر[7]، 1963) نظریه تعمیمپذیری را تثبیت کرد (سوئن و لی،2007 ). برنان[8](b2010) متذکر میشود که تفاوتهای میان مدلها بنیادی و مهم هستند، اما هریک از این مدلها قابل دفاع و سودمند هستند، و هیچیک از آنها جایگزینی برای دیگری نیست. همچنین از اینکه بیشتر تحقیقات فعلی در اندازهگیری آموزشی به تفاوتهای میان این مدلها، مخصوصاً تفاوت های میان مفروضاتشان توجهی نمیکنند، اظهار تأسف میکند. بنا به مطالب ذکر شده و در راستای موضوع پژوهش، در این بخش تلاش میشود که به معرفی سه نظریه مذکور و شرح مفاهیم، مفروضات، محدودیتها و تقابلهای آنها پرداخته شود.
[1].Charles spearman
[2].Gulliksen
3. Frederic Lord
4.Georg Rasch
5.Cronbach
6. Rajaratnam
7.Gleser
8. Brennan
...
انواع تصمیم و واریانسهای خطا
در یک وضعیت اندازهگیری، نوع تفسیر نمره (هنجار در مقابل ملاکمرجع) تعیین می کند که کدام تصمیم (نسبی یا مطلق) مناسب است و واریانس خطا به طور متفاوتی برای هر نوع از تصمیم تعریف می شود. یک تصمیم مطلق[1] است اگر تصمیم درباره افراد مبنی بر نمراتشان در ارتباط با یک ملاک باشد. به بیانی دیگر، تصمیم مطلق بر روی سطح عملکرد افراد بدون توجه به رتبهی آنها متمرکز است و در ارتباط با ثبات جایگاه نسبی افراد و هم ثبات نمرات واقعی است. واریانس خطا برای تصمیم مطلق را با علامت نشان میدهند و آنرا واریانس خطای مطلق[2] می نامند که شامل همه مؤلفههای واریانس مدل به جز هدف اندازهگیری است. این نوع واریانس بیانگر تفاوت میان نمره مشاهده شده و نمره جهان فرد است. یک تصمیم نسبی[3] است اگر تصمیم درباره افراد مبتنی بر جایگاهشان در ارتباط با دیگران باشد. این نوع تصمیم بر روی تفسیر نمره هنجارمرجع متمرکز است. یعنی نمرات اندازهگیری برای متمایز کردن آزمودنیها به کار میروند. اعتبار اندازهگیری در این حالت مربوط به ثبات جایگاه نسبی افراد است نه در مورد ثبات نمرات واقعی. واریانس خطا برای تصمیم نسبی را با علامتنشان می دهند و آن را واریانس خطای نسبی[4] مینامند. این نوع واریانس شامل همه ی مؤلفههای واریانس تعاملی است که هدف اندازهگیری را در بر میگیرد. واریانس خطای نسبی به صورت تفاوت میان نمره انحرافی مشاهده شده شخص[5] و نمره انحرافی جهان[6] او تعریف میشود. این نوع واریانس مشابه واریانس خطا در CTT است. ریشه دوم واریانسهای خطا (نسبی و مطلق)، برآوردی از خطای استاندارد اندازهگیری (نسبی و مطلق) است که میتوان از آن در جهت ساخت فواصل اطمینان حول نمره جهان فرد استفاده کرد.
در کل واریانس خطای نسبی کمتر از واریانس خطای مطلق است زیرا شامل مؤلفههای واریانس کمتری است. این نشان میدهد که تفسیرهای نسبی در مورد نمرات افراد نسبت به تفسیرهای مطلق کمتر مستعد خطا هستند. در شکل زیر، تفاوت میان خطای مطلق و خطای نسبی طرح P×Iنشان داده شده است. قسمتهای هاشور خورده، سهم واریانس خطا تحت سطوح مختلف است. ...
[1].absolute decision
[2].absolute error variance
[3].relative decision
[4].relative error variance
[5].person’s observed deviation score
[6].universe deviation score
...
نظریه تعمیم پذیری در مقابل نظریه کلاسیک آزمون
برنان (b2010) از شباهتهای دو نظریهی تعمیمپذیری و کلاسیک آزمون به موارد زیر اشاره میکند؛ هر دو نظریه نمره واقعی (یا جهان) را به عنوان یک ارزش مورد انتظار از نمرات مشاهده شده تعریف میکنند. هر دو نظریه به وضوح خطاهای اندازهگیری تصادفی را شامل میشوند و مفاهیم اعتبار( یا تعمیمپذیری) در هر دو نظریهبه خوبی تعریف شده است.
این دو نظریه به رغم شباهتهایی که دارند، تفاوتهای بسیار مهمی نیز دارند که در زیر به شرح مواردی از آن پرداخته میشود.
- چارچوب مفهومی : GT نسبت به CTT چارچوب مفهومی قدرتمندتری دارد که منجر به برطرف کردن
تعدادی از تناقضات آشکار در چند بحث CTT از اعتبار شده است. دو ویژگی مهم GT که به حل تناقضات
کمک میکند عبارتند از: تمایز گذاشتن GT میان رویههای اندازهگیری ثابت و تصادفی و همچنین قابلیت این نظریه در پرداختن به طرحهای مختلف مطالعه D( برنان، b2010).
- مفروضات زیربنایی آماری: در CTT مفروضات آزمونهای موازی و آزمونهای اساساً تائو معادل،
اغلب غیرقابل دفاع هستند. در حالیکه GTفرض میکند که آزمونها تصادفی موازی هستند و محتوای آزمون یک نمونه تصادفی از حیطه یا جهان تعریف شده در نظر گرفته میشود. برنان (b2010) بیان میکند که هر دو نوع موازی بودن ایده آل هستند و هیچگاه احتمال اینکه کاملاً واقعیت داشته باشد، نیست. اگر چه یکی یا دیگری ممکن است در زمینهای خاص مناسبتر باشد.
- مدلسازی نمرات مشاهده شده: در CTTنمره ی مشاهده شده یک فرد در آزمون مبتنی بر نمره واقعی
شخص در آزمون و خطای اندازهگیری است. در GT هر نمره مشاهده شده معرف یک نمونه از تمام نمرات ممکن فرض میشود و در قالب یک یا چند مؤلفه واریانس بیان میشود. نمره مشاهده شده در یک آزمون از رویههای مختلف مورد استفاده در آزمون تأثیر میپذیرد و با توجه به رویههای مورد استفاده در آزمون معرف عملکرد فرد در همان رویههاست.
- منابع چندگانه ی خطای اندازه گیری: همانطور که سوئن و لی (2007) مطرح کردهاند؛ در وضعیتهای
اندازهگیری پیچیده که با منابع چندگانهای از خطای اندازهگیری (رویهها) روبهرو است، نمرهی مشاهده شده نتیجهی نمرهی واقعی باضافهی اثرات و تعاملات این منابع چندگانه خطاهای اندازهگیری است. روش معمول CTT در چنین وضعیتهای اندازهگیری برای برآورد اعتبار این است که از روشهای مختلفی (همچون بازآزمایی، بین ارزیابان، همسانی درونی،... ) استفاده میکند. روشهای مختلف، ضرایب اعتبار مختلفی را به دنبال دارند که این نیز به نوبهی خود منجر به خطاهای استاندارد اندازهگیری متفاوتی میشود. مسئلهای که اینجا پیش میآید این است که در چنین وضعیتی دقیقترین برآورد ضریب اعتبار کدام است؟ و به منظور ساخت فاصلههای اطمینان حول نمرات مشاهده، کدام خطای استاندارد اندازهگیری را باید به کار برد؟ متأسفانه CTT قادر به پاسخگویی به این سوالات نیست. در حالیکه در GT میتوان منابع چندگانه خطا را همزمان در ترکیبهای متفاوتی از تصادفی یا ثابت در نظر گرفت. با تشخیص اینکه آیا یک رویه تصادفی یا ثابت باشد امکان برآورد اعتبار و خطای استاندارد ناشی از منابع معین خطا در GT وجود دارد. به بیانی دیگر، GT سهم هر منبع خطا (رویه) را در واریانس نمرات آزمون تعیین میکند و فرصت محاسبهی برآوردهای متفاوتی از اعتبار را میدهد که بستگی به این دارد کدام منبع خطا برای هر استفاده ی خاص از آزمون مهم در نظر گرفته میشود. فن و سان (2013) بیان میکنند که در چنین وضعیتهای اندازهگیری، CTT قادر به برآورد اعتبار نیست زیرا شیوههای سنتی اعتبار تنها برای یک رویه طراحی شدهاند. از این رو CTT نمیتواند به بررسی منابع چندگانه خطای اندازهگیری بپردازد. سوئن و لی[1](2007) نیز اذعان داشتند، این گونه نیست که CTT وجود منابع چندگانه خطاهای اندازهگیری را انکار کند، بلکه حقیقت این است که این نظریه نمیتواند از لحاظ مفهومی و آماری آن را در خود جای دهد در حالیکه، GT نه تنها میتواند از نظر مفهومی تصور داشتن انواع مختلفی از ضریب اعتبار را در خود لحاظ کند، بلکه میتواند یک مکانیسم عملی برای انجام آن نیز داشته باشد. ...
...
[1]. Suen & Lei
خرید و دانلود آنی فایل