עיבוד נתונים וניתוחם/מדדים

מתוך ויקיספר, אוסף הספרים והמדריכים החופשי

שכיחות (frequency) - מספר הפעמים שערך מופיע במדגם מסוים. בתוכנת SPSS אנו נציג ערכים אלו בטבלת שכיחויות (frequency distribution).

מדדי מיקום יחסי (central tendency)[עריכה]

שכיח (mode) – מדד המציג את הערך בעל התדירות הגבוהה ביותר.

  • משתנה שמי והלאה - שכיח קיים לכל הסולמות של המשתנים.
  • שכיח אינו מושפע מערכים קיצוניים.

חציון (median) - ערך של המשתנה שמחצית המשתנים הקיימים במחקר קטנים ממנו או שווים לו, ומחצית המקרים גדולים ממנו או שווים לו. במילים אחרות הוא הערך האמצעי של ההתפלגות המשתנים.

  • סדר והלאה - ניתן למצוא חציון לממשתנים מסולם סדר ומעלה.
  • חציון מושפע מעט מערכי קיצון.

חישוב:

  • מספר אי זוגי של משתנים החציון נמצא במקום : .
  • מספר זוגי של משתנים החציון הוא ממוצע של האיבר במקום לבין .

ממוצע (mean) - סכום הערכים של המשתנה לכל המשתתפים חלקי מספר המשתתפים.

  • סולם רווח או מנה - ממוצע קיים למשתנים מסולם רווח או מנה.
  • הממוצע מושפע מערכים קיצונים.
  • חישוב: סכום השכיחות של הערכים בסדרה כפול ערכו חלקי מספר האיברים בסדרה. דוגמה הממוצע של הסדרה הוא
  • סכום ההפרשים של ערכי הסדרה הסטטיסטית מהממוצע שלהם שווה אפס, דוגמה, הממוצע של הסדרה הוא אי לכך,

מדדי פיזור (dispersion)[עריכה]

פיזור – טווח הערכים של סדרה המתארים כמה היא הומוגנית. ככל שהפיזור גדול יותר כך ערכי הסדרה פזורים יותר.

  • אם כל הערכים שווים הפיזור שווה אפס
  • אם הסדרה היא הטרוגנית הפיזור שווה אינסוף.
  • סדר ומעלה - ניתן לפמצוא פיזור למשתנה סדר ומעלה

חישוב: ההפרש של איבר בסדרה מהממוצע:

תחום (range) - ההפרש בין הערך הגדולה ביותר של סדרה לבין הערך הקטן ביותר .

  • ממשתנה רווח או מנה ומעלה
  • התחום מושפע מערכי הקיצון בלבד. הוא אינו מבטא את הפיזור של כל הערכים בסדרה במילים אחרות לא ברור מה קורה באמצע ההתפלגות.

מיקום יחס (percentile values)[עריכה]

  • מיקום יחסי הוא מדד שמאפשר לדעת את ערכו של משתנה ביחס למשתנים אחרים באותה סדרה למשל ציון של סטודנט ביחס ליתר ציוני הסטודנטים.
  • ערכים שהם מדדים טהורים דהיינו אינם תלוים בסוג יחידות המדידה. למשל, ציון תקן מבטא שהציון של משתתף הוא הציון הממוצע. לא משנה אם המשתנה שמדדנו הוא ציון של מבחן שנע בין 1 ל-100, ציון של פסיכומטרי שנע בין 200 ל-800 או משכורת. לעומת זאת, מדדים אחרים כמו ממוצע או סטיית תקן, מחייבים לדעת את ערך יחידות המדידה של המשתנה על מנת להעריך אותו. לדוגמה אם ציון המומצע של תלמיד הוא 62 אנו לא יכולים להעריך האם ציון זה גבוה או נמוך מיתר הערכים.

אחוזונים (percentiles)[עריכה]

אחוז התצפיות שקטנות מציון מסוים או שוות לו. מסומנים ב.

  • = חציון (Median).
  • = רבעון תחתון .
  • = רבעון עליון שווים לו או מעליו.
  • עשירונים – למשל העשירון העליון מהמשתתפים שווים לו אם מעליו.
העשירון התחתון - מהמשתתפים שווים לו או מתחתיו ביקורת.

רבעונים (Quartiles)[עריכה]

חלוקת התפלגות הערכים לארבע רבעונים

רבעונים
  • הרבעון הראשון כולל מהערכים הנמוכים בהתפלגות
  • הרבעון השני כולל ערכים בין ל
  • הרבעון השלישי כולל ערכים בין ל
  • הרבעון הרביעי כולל את הערכים הגבוהים ביותר בהתפלגות.

טווח או תחום בין רבענים (IQR)[עריכה]

הרבעון השני + הרבעון השלישי - המרחק בין הרבעון הראשון לרבעון השלישי אשר מהפרטים המרכזיים בהתפלגות נמצאים ביניהם.

  • משתנה מנה
  • תחום אינו מושפע מערכים קיצונים.

שונות [עריכה]

מודד את הפיזור של ערכי הסדרה הסטטיסטית סביב הממוצע

  • משתנה רווח
  • משופע מערכים קיצונים

חישוב: פיזור מחושב על ידי ההפרש של איבר בסדרה מהממוצע: . כאמור סכום ההפרשים של ערכי הסדרה הסטטיסטית מהממוצע שלהם שווה אפס, דוגמה, הממוצע של הסדרה הוא אי לכך, לכן אם אנו רוצים לחשב את הפיזור של סכום ההפרשים מערכי הסדרה הסטטיסטית נקבל אפס ולכן בנוסחה לחישוב השונות, סכום הסטיות מהממוצע מעולה בשתים.

סטיית תקן [עריכה]

ייצוג הפיזור של ערכי סדרה על ציר ה. הפיזור תלוי במרחק של המשתנים מהממוצע שלהם.

  • הממוצע מייצג את סדרתו - ככל שסטיית התקן קטנה יותר כך הפיזור של הערכים קרוב יותר לממוצע (מפוזר פחות)
  • X_n < SD הממוצע אינו מייצג את סדרתו. כשסטיית התקן גדולה מהממוצע אזי הממוצע אינו מייצג את הסדרה ולכן אם אדם קיבל סטיית תקן וכל הכיתה סימן שציונו אינו מיצג את הסדרה.
  • משתנה רווח לפחות.
  • מושפע מערכים קיצונים.
  • נתונה ביחידות של המשתנה ולכן ניתן להשוות אותה לממוצע.
  • חישוב: סטיית התקן היא השורש הריבועי של השונות .

ציון תקן [עריכה]

מיקום יחסי של תצפית בסדרה ביחס לממוצע בהשוואה ליתר התצפיות בהתפלגות. ציון תקן חיובי פירושו ציון מעל ממוצע יתר התצפיות. ככל שהערך של ציון התקן גדול יותר בערך המוחלט שלו (חיובי או שלילי) הנתון רחוק יותר מהממוצע. נע בין הערכים .