הבהרה בנוגע לשימוש בלשון זכר: כדי למנוע סרבול מיותר, וכמקובל בשפה העברית, ננקטת לעתים לשון זכר בהתייחסות אל כלל הגולשות והגולשים ובמתן שמות לערכים. אנא קבלו זאת בהבנה.
נגדיר . בלי הגבלת הכלליות, נניח ש.
להלן עץ הפרישה המתקבל:
בעץ זה, לכל אחד מהצמתים המצויירים שני ילדים: אם הצומת מתאים לגודל , אז הילד השמאלי מתאים ל, והימני מתאים ל,. מכאן אפשר לראות שמסלולים שמאליים בעץ קצרים יותר ממסלולים ימניים, כי . לא כל הרמות בעץ מלאות, אם כן, מה שמקשה מעט על ניתוח הסיבוכיות. נגדיר כ את אורך המסלול השמאלי ביותר, וכ את אורך המסלול הימני ביותר.
קל לראות שכל רמה מלאה בעץ תורמת . הרמה הראשונה תורמת ; הרמה השניה תורמת , הרמה השלישית תורמת ; וכו'. (אפשר להראות זאת פורמאלית באינדוקציה.)
אפשר לראות, לכן, ש חסומה מלמטה ע"י , וחסומה מלמעלה ע"י . אבל היות ש וכן , אז .
כדי להבין מה עושה הפונקציה כאשר היא מקבלת את הקלט , נחשוב על הייצוג הבינרי של , נניח
(כלומר נניח ש הנו מספר בעל ביטים, בעל הביט החשוב ביותר
,
והביט החשוב פחות
).
כעת נראה מה הפונקציה עושה.
בשורה 3, הביטוי הוא בדיוק ערך הביט .
שוב בשורה 3, Foo( ⌊n / 2⌋ ) היא הקריאה לאותה פונקציה, אך עם הערך .
מכאן ברור שהפונקציה פשוט סוכמת את הביטים של . אפשר להראות זאת פורמלית באינדוקציה.
מהתבוננות בשלוש שורות הפונקציה, ברור שלמעט הקריאה הרקורסיבית, כל הפעולות הן בזמן קבוע. מכאן נקבל את נוסחת הנסיגה
.
נזכר שוב שמותר לנו (בקורס זה) להתעלם משגיאות עיגול בנוסאות נסיגה של זמן ריצה, ולכן נוסחת הנסיגה היא
.
כבר ראינו (בדף על נוסחאות נסיגה) שפתרון נוסחה זו הוא
.
הפתרון משתמש ברעיון "divide and conquer", כלומר פתרון בעיות "גדולות" ע"י פתירת בעיות "קטנות" יותר.
הפתרון מתבסס על שינויים קלים במיון מיזוג. ראשית, נתבונן בפסוודו-קוד הבא, שהוא ווריאציה קלה על Merge:
# A global variable that counts the number of inversions.1inv# Merge and count inversions. # Takes two sorted arrays (L, R).# Returns a sorted array of L ∪ R, and counts how many members# of L and R are inverted relative to each other.Merge-Count-Inversions(L,R)1Merged=Make-Array(Length(L)+Length(R))2l=r=m=13whilel<=Length(L)orr<=Length(R)4ifr>Length(R)5Merged[m++]=L[l++]6inv=inv+r-17elseifl>Length(L)8Merged[m++]=R[r++]9elseifL[l]inv=inv+r-110Merged[m++]=L[l++]11inv=inv+r-112else13Merged[m++]=R[r++]14returnMerged
המשתנה הגלובלי inv (ב1) שומר על מספר ההפכים. הפונקציה Merge-Count-Inversions כמעט זהה לפונקציה Merge שאותה כבר פגשנו, למעט השורות 6 ו11 שנוספו - שורות אלה מעדכנות את inv בכל פעם שנלקח איבר מL.
משפט:
אם Merge-Count-Inversions נקראת עם L וR ממוינים כלשהם, אז בסיום הקריאה:
הפונקציה מחזירה מערך ממוין של איחוד איבריהם.
למשתנה inv נוספו בדיוק מספר ההפכים בין איברי L לאיברי R (כלומר, מספר האיברים בL שגדולים מאיברים בR).
הוכחה: את החלק הראשון של המשפט הוכחנו כבר לגבי Merge, ולכן יש להוכיח רק את חלקו השני.
נניח שאחת משורות 4 או 9 בוחרת למזג את L[l]. בשלב זה, מספר האיברים שכבר נלקחו מR הוא r - 1, וכל אחד מאיברים אלה קטן בהכרח מL[l], או, במילים אחרות, מרכיב הפך בייחס לL[l]. מצד שני, כל איבר בR שעדיין לא נבחר, בהכרח גדול מL[l], ולכן אינו מרכיב הפך בייחס לL[l]. לכן כשנבחר L[l], הפונקציה מוסיפה לinv בדיוק את מספר ההפכים שהוא חלק מהם. היות שהפונקציה בוחרת בשלב כלשהו כל איבר מL, היא מוסיפה לinv את סך כל ההפכים בין L לR, בדיוק כפי שנטען.
כדי להשלים את הפתרון, פשוט נכתוב שוב פעם את Merge-Sort , אלא שבמקום לקרוא לMerge נקרא לMerge-Count-Inversions:
# Merge sort also counting inversions. # Takes an array (Values).# Returns an array of the same elements, sorted in increasing order; also increases global variable inv # by the number of inversions.Merge-Sort-Count-Inversions(Values)1ifLength(Values)<=12returnValues3mid=⌊(1+Length(Values))/2⌋4L=Merge-ּSort-Count-Inversions(Values[1,...,mid])5R=Merge-Sort-Count-Inversions(Values[mid+1,...,Length(Values)])6returnMerge-Count-Inversions(L,R)
לפני הקריאה הראשונה לMerge-Sort-Count-Inversions נאפס את המשתנה הגלובאלי inv. בסיום המיון, המשתנה inv יכיל את מספר ההחלפות, כפי שמראה המשפט הבא.
משפט:
בסיום המיון, המשתנה inv יכיל את מספר ההחלפות.
הוכחה: ההוכחה היא באינדוקציה על אורך המערך. נוכיח שבקריאה לMerge-ּSort-Count-Inversions במערך שארכו , מספר ההפכים במערך מיתוסף לinv.
(בסיס האינדוקציה) אם אורך המערך הוא 0 או 1, אז שורה 2 של IMerge-ּSort-Count-Inversions תצא ישר. inv לא ישתנה מערכו ההתחלתי של 0, בדיוק כפי שאמור להיות (אין הפכים במערך ריק או במערך בעל איבר יחיד).
(מעבר האינדוקציה) נניח שאורך המערך גדול (ממש) מ1. יש שלושה סוגי הפכים אפשריים במערך:
הפכים בין איברים בחציו השמאלי לבין עצמם
הפכים בין איברים בחציו הימני לבין עצמם
הפכים בין איברים בחציו השמאלי לבין איברים בחציו הימני
כל אלו בהכרח מחושבים נכון:
הפכים בין איברים בחציו השמאלי לבין עצמם מיתוספים נכון (עפ"י הנחת האינדוקציה) בשורה 4 של Inversions-Imp.
הפכים בין איברים בחציו הימני לבין עצמם מיתוספים נכון (עפ"י הנחת האינדוקציה) בשורה 5 של Inversions-Imp.
הפכים בין איברים בחציו השמאלי לבין איברים בחציו הימני מחושבים נכון בפונקציה Merge-Count-Inversions, כפי שהוכחנו קודם. אמנם הפונקציה אינה נקראת על חלקי המערך המקוריים, אלא על פרמוטציות שלהם (שהרי 4 ו5 ממיינות אותם), אך לפרמוטציות בהכרח אותו מספר ההפכים אחד בייחס לשני.
קל לראות שהאלגוריתם עובד בזמן - ההוכחה זהה לזו של ניתוח הסיבוכיות במיון מיזוג.
מהפרישה אפשר לראות (ולהוכיח פורמלית באינדוקציה), שכל רמה תורמת , והארגומנטים קטנים מרמה לרמה לפי שורש. אם גובה העץ הוא , אז סכום הרמות הוא
.
נותר למצוא את .
נתבונן בעמודה האחרונה, ונספור את מספר ה0-ים ומספר ה1-ות שאנו רואים. היות שיש , שורות, אז מספר ה0-ים גדול ב1 ממספר ה1-ות, או הפוך. נניח שמספר ה0-ים גדול ב1 ממספר ה1-ות (המקרה השני
סימטרי). נוכל להסיק שני דברים:
הספרה החסרה בעמודה זו היא 1.
עלינו להתמקד רק בשורות בהן הספרה בעמודה זו היא 1 (קומבינטורית, לא ייתכן אחרת).
כעת נתחיל את הבעיה מחדש, תוך התמקדות בחצי (בערך) מהשורות (רק אלה בהן הספרה בעמודה זו היא 1): נסתכל בעמודה הלפני אחרונה,נספור את מספר ה0-ים ומספר ה1-ות שאנו רואים , וכולי.
1-4 מאתחלות את המחסניתRows כך שתכיל את כל (מספרי השורות). 5-19 עובורת על כל העמודות. בכל איטרציה, 8-13 מחלקות את מספרי השורות בRows לשתי מחסניות, לפי ערך ביט העמודה הנכחית. 14-19 מדפיסות את הביט החסר בעמודה הנכחית, ומחליטות באיזו משתי המחסניות להתמקד.
נותר לנתח הסיבוכיות. נשים לב שהאיטרציה הראשונה פועלת בזמן , האיטרציה השניה
בזמן , ובאופן כללי, האיטרציה ה בזמן . זמן הריצה, לכן, הוא
נשתמש בעץ פרישה. ברמה הראשונה יש צומת יחיד, והוא תורם . ברמה השניה יש צמתים, וכל אחד מהם תורם . ברמה ה (בהנחה שהרמה הראשונה היא
ב), יש צמתים, וכל אחד מהם תורם . אנו יודעים שגובה העץ הוא . נפשט:
נשים לב שעפ"י חסמי האינטגרלים לטורים, .