בפרק זה נעסוק במשוואות כלליות ממעלה שלישית בתבנית
a
x
3
+
b
x
2
+
c
x
+
d
=
0
{\displaystyle ax^{3}+bx^{2}+cx+d=0}
.
יש לציין כי הנושא לא שייך במישרין למתמטיקה תיכונית, שכן הוא ארוך ומסובך בהרבה ממשוואות ריבועיות ולמרבה הפלא כולל שימוש בלתי־נמנע בהמצאה מתמטית חדשה והיא "מספרים מרוכבים ". לא מרבים להתעסק בזה בבתי־ספר ואף באוניברסיטאות, ולא נטעה אם נאמר כי תלמיד ממוצע אינו מכיר את הנושא.
לפני כ־500 שנה, עסקו מתמטיקאים איטלקיים בבעיה זו. כפי שהאלגוריתם הטריוויאלי למציאת שורשי "משוואה ריבועית" היה ידוע, הם ניסו למצוא אלגוריתם למציאת שורשי "משוואה קובית".
כמה מאותם מתמטיקאים, הידועים בשמות לוקה פאצ'ולי , שיפיונה דל־פרו , אנטוניו פיור, ניקולו פונטאנא (טארטאגליה) , ג'ירולמו קארדאנו , לודוויקו פרארי , היו עורכים ביניהם תחרויות ידע פומביים בהתערבויות כספיות. רובם היו שומרים בסוד את פתרונותיהם כדי שיוכלו להביס את יריביהם בהתערבות. המפסידים היו נאלצים לפנות את משרותיהם באוניברסיטות לטובת מנצחיהם.
פאצ'ולי, כנראה עקב כמה נסיונות נפל, פרסם ספר בשנת 1494 ובו טען כי לא ניתן לפתור משוואות אלו בשיטות האלגבריות המוכרות.
הדבר דירבן את המתמטיקאי דל־פרו כמה שנים מאוחר יותר למצוא פתרון למשוואות מסוג
x
3
+
a
x
+
b
=
0
{\displaystyle x^{3}+ax+b=0}
, שאותו שמר בסוד זמן מה עד שהפקידו בידי תלמידו פיור, שעשה בו שימוש בהתמודדות מול טארטאגליה ("גמגמן"). לתדהמתו, זה האחרון מצא פתרון לסוג המשוואות
x
3
+
a
x
2
+
b
=
0
{\displaystyle x^{3}+ax^{2}+b=0}
כמו גם את פתרונו שלו והביס אותו.
עתה ניצב טארטאגליה מול מתחרה נוקשה יותר, קארדאנו, שלאחר מאמצים ושכנועים כבירים הצליח להוציא מטארטאגליה את פתרונו באמצעות שיר צופן, תוך שבועה שישמור סוד עד אשר ידפיס טארטאגליה הכל בספר משלו. בעזרת תלמידו פרארי הרחיב קארדאנו את האפשרויות למשוואות מסוג
a
x
3
+
b
x
2
+
c
x
+
d
=
0
{\displaystyle ax^{3}+bx^{2}+cx+d=0}
תוך הפיכתן למשוואה פשוטה יותר כשל טארטאגליה. תוך כדי כך, גילה פרארי פתרון אחר הקשור למשוואה ממעלה רביעית (קווארטית).
כשרצו השניים לפרסם זאת בספר משלהם, הם לא ידעו כיצד להפר את השבועה הסודית לטארטאגליה. ואז, בשיחה עם יורשו של דל־פרו, דלה־נאווה, התברר להם כי דל־פרו אכן פתר בסוד את המשוואה הקובית לפני טארטאגליה, כך שהשבועה בטלה כביכול. הם פרסמו את הפתרונות בספר האומנות הגדולה . הם הסתכסכו עם הגמגמן הזועם, וזה לבסוף ערך תחרות עם פרארי, שהביסו בקלות.
ומה הקשר למרוכבים?
ברם, כשהרחיב קארדאנו את הפתרון לעיל, גילה לתדהמתו כי ישנן משוואות קוביות בהן השימוש בפתרונו מוביל לביטוי סתום של מספר שלילי תחת סימן שורש ריבועי.
היה זה אבסורד, שכן אין מספר ממשי שריבועו הוא מספר שלילי. גם כך, המספרים השליליים לא היו מוכרים בשימוש נרחב.
לפי המסופר, היתה זו המשוואה
x
3
=
15
x
+
4
{\displaystyle x^{3}=15x+4}
שאת פתרונה הפשוט
x
=
4
{\displaystyle x=4}
ניסה להפיק תוך שימוש באלגוריתם שלו.
התוצאה היתה, נשמו עמוק:
x
=
2
+
−
121
3
+
2
−
−
121
3
{\displaystyle x={\sqrt[{3}]{2+{\sqrt {-121}}}}+{\sqrt[{3}]{2-{\sqrt {-121}}}}}
אך כיון שהוא ידע את פתרונה האמיתי הנ"ל, הוא הבין שיש לבצע פעולות באמצעות ה"קשקוש" שלפניו כדי להגיע לפתרון הרגיל – בדיוק כפי שיש שימוש למספרים שליליים לפתרון שורשים חיוביים במשוואה ריבועית וכדומה.
כיצד הגיע קארדאנו למשוואת התשובה הנ"ל? אין צורך למהר – בעוד כמה שורות הכל יתבהר לכם.
נתונה לנו המשוואה
a
x
3
+
b
x
2
+
c
x
+
d
=
0
{\displaystyle ax^{3}+bx^{2}+cx+d=0}
נחלק אותה במקדם של
x
3
{\displaystyle x^{3}}
:
x
3
+
b
a
x
2
+
c
a
x
+
d
a
=
0
{\displaystyle x^{3}+{\frac {b}{a}}x^{2}+{\frac {c}{a}}x+{\frac {d}{a}}=0}
ננסה להשלים אותה לקוביה מהתבנית
(
x
+
y
)
3
=
x
3
+
3
x
2
y
+
3
x
y
2
+
y
3
{\displaystyle (x+y)^{3}=x^{3}+3x^{2}y+3xy^{2}+y^{3}}
.
נחבר ונחסר ביטויים מתאימים:
(
x
3
+
3
(
b
3
a
)
x
2
+
3
(
b
3
a
)
2
x
+
(
b
3
a
)
3
)
+
c
a
x
−
3
(
b
3
a
)
2
x
−
(
b
3
a
)
3
+
d
a
=
0
(
x
+
b
3
a
)
3
+
c
a
x
−
3
(
b
3
a
)
2
x
−
(
b
3
a
)
3
+
d
a
=
0
(
x
+
b
3
a
)
3
+
(
3
a
c
−
b
2
3
a
2
)
x
+
27
a
2
d
−
b
3
27
a
3
=
0
(
x
+
b
3
a
)
3
+
3
a
c
−
b
2
3
a
2
(
x
+
b
3
a
−
b
3
a
)
+
27
a
2
d
−
b
3
27
a
3
=
0
(
x
+
b
3
a
)
3
+
3
a
c
−
b
2
3
a
2
(
x
+
b
3
a
)
−
b
3
a
(
3
a
c
−
b
2
3
a
2
)
+
27
a
2
d
−
b
3
27
a
3
=
0
(
x
+
b
3
a
)
3
+
3
a
c
−
b
2
3
a
2
(
x
+
b
3
a
)
+
2
b
3
+
27
a
2
d
−
9
a
b
c
27
a
3
=
0
y
3
+
m
y
+
n
=
0
{\displaystyle {\begin{matrix}{\color {Orange}{\Bigg (}}x^{3}+{\color {red}3\left({\dfrac {b}{3a}}\right)x^{2}}+{\color {green}3\left({\dfrac {b}{3a}}\right)^{2}x}+{\color {blue}\left({\dfrac {b}{3a}}\right)^{3}}{\color {Orange}{\Bigg )}}+{\dfrac {c}{a}}x-{\color {green}3\left({\dfrac {b}{3a}}\right)^{2}x}-{\color {blue}\left({\dfrac {b}{3a}}\right)^{3}}+{\dfrac {d}{a}}=0\\\\{\color {Orange}\left(x+{\dfrac {b}{3a}}\right)^{3}}+{\dfrac {c}{a}}x-3\left({\dfrac {b}{3a}}\right)^{2}x-\left({\dfrac {b}{3a}}\right)^{3}+{\dfrac {d}{a}}=0\\\\\left(x+{\dfrac {b}{3a}}\right)^{3}+\left({\dfrac {3ac-b^{2}}{3a^{2}}}\right){\color {JungleGreen}x}+{\dfrac {27a^{2}d-b^{3}}{27a^{3}}}=0\\\\\left(x+{\dfrac {b}{3a}}\right)^{3}+{\dfrac {3ac-b^{2}}{3a^{2}}}{\color {JungleGreen}\left(x+{\dfrac {b}{3a}}-{\dfrac {b}{3a}}\right)}+{\dfrac {27a^{2}d-b^{3}}{27a^{3}}}=0\\\\\left(x+{\dfrac {b}{3a}}\right)^{3}+{\dfrac {3ac-b^{2}}{3a^{2}}}{\color {JungleGreen}\left(x+{\dfrac {b}{3a}}\right)}-{\color {JungleGreen}{\dfrac {b}{3a}}}\left({\dfrac {3ac-b^{2}}{3a^{2}}}\right)+{\dfrac {27a^{2}d-b^{3}}{27a^{3}}}=0\\\\{\color {RoyalBlue}\left(x+{\dfrac {b}{3a}}\right)^{3}}+{\dfrac {3ac-b^{2}}{3a^{2}}}{\color {RoyalBlue}\left(x+{\dfrac {b}{3a}}\right)}+{\dfrac {2b^{3}+27a^{2}d-9abc}{27a^{3}}}=0\\\\{\color {RoyalBlue}y^{3}}+m{\color {RoyalBlue}y}+n=0\end{matrix}}}
כיצד נמשיך מכאן?
למרבה ההפתעה, משוואה זו פתירה בקלות יחסית, שכן היא תואמת תבנית
(
A
±
B
)
3
∓
3
A
B
(
A
±
B
)
=
A
3
±
B
3
{\displaystyle (A\pm B)^{3}\mp 3AB(A\pm B)=A^{3}\pm B^{3}}
קישור להוכחת התבנית כאן
נבחר בלי הגבלת הכלליות
y
=
A
+
B
{\displaystyle y=A+B}
.
y
=
A
+
B
,
m
=
−
3
A
B
,
n
=
−
A
3
−
B
3
B
=
−
m
3
A
,
B
3
=
−
n
−
A
3
A
3
=
−
n
−
(
−
m
3
A
)
3
(
A
3
)
2
+
n
(
A
3
)
+
(
−
m
3
)
3
=
0
A
3
=
−
n
2
±
1
2
n
2
−
4
(
−
m
3
)
3
A
=
−
n
2
±
(
n
2
)
2
+
(
m
3
)
3
3
B
=
−
n
2
∓
(
n
2
)
2
+
(
m
3
)
3
3
x
=
A
+
B
−
b
3
a
{\displaystyle {\begin{matrix}y=A+B\quad ,\quad m=-3AB\quad ,\quad n=-A^{3}-B^{3}\\\\B=-{\dfrac {m}{3A}}\quad ,\quad B^{3}=-n-A^{3}\\\\A^{3}=-n-\left(-{\dfrac {m}{3A}}\right)^{3}\\\\(A^{3})^{2}+n(A^{3})+\left(-{\dfrac {m}{3}}\right)^{3}=0\\\\A^{3}=-{\dfrac {n}{2}}\pm {\dfrac {1}{2}}{\sqrt {n^{2}-4\left(-{\dfrac {m}{3}}\right)^{3}}}\\\\A={\sqrt[{3}]{-{\dfrac {n}{2}}\pm {\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}\qquad \qquad B={\sqrt[{3}]{-{\dfrac {n}{2}}\mp {\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}\\\\x=A+B-{\dfrac {b}{3a}}\end{matrix}}}
שימו לב: עלינו לקחת בחשבון כי מעל המרוכבים למשוואה הקובית עד 3 פתרונות, לכן המספר 1 הוא בעל 3 שורשים:
ω
1
=
−
1
2
+
3
2
i
,
ω
2
=
−
1
2
−
3
2
i
,
ω
3
=
1
{\displaystyle \omega _{1}=-{\dfrac {1}{2}}+{\dfrac {\sqrt {3}}{2}}i,\quad \omega _{2}=-{\dfrac {1}{2}}-{\dfrac {\sqrt {3}}{2}}i,\quad \omega _{3}=1}
כאשר מוציאים 1 מתוך כל אחד מהשורשים הקוביים במשוואה הראשונית
x
1
{\displaystyle x_{1}}
מקבלים את המשוואות הבאות:
x
1
=
−
n
2
+
(
n
2
)
2
+
(
m
3
)
3
3
+
−
n
2
−
(
n
2
)
2
+
(
m
3
)
3
3
−
b
3
a
x
2
=
ω
1
−
n
2
+
(
n
2
)
2
+
(
m
3
)
3
3
+
ω
1
2
−
n
2
−
(
n
2
)
2
+
(
m
3
)
3
3
−
b
3
a
x
2
=
ω
1
2
−
n
2
+
(
n
2
)
2
+
(
m
3
)
3
3
+
ω
1
−
n
2
−
(
n
2
)
2
+
(
m
3
)
3
3
−
b
3
a
{\displaystyle {\begin{matrix}\color {red}x_{1}={\sqrt[{3}]{-{\dfrac {n}{2}}+{\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}+{\sqrt[{3}]{-{\dfrac {n}{2}}-{\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}-{\dfrac {b}{3a}}\\\\\color {red}x_{2}=\omega _{1}{\sqrt[{3}]{-{\dfrac {n}{2}}+{\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}+\omega _{1}^{2}{\sqrt[{3}]{-{\dfrac {n}{2}}-{\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}-{\dfrac {b}{3a}}\\\\\color {red}x_{2}=\omega _{1}^{2}{\sqrt[{3}]{-{\dfrac {n}{2}}+{\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}+\omega _{1}{\sqrt[{3}]{-{\dfrac {n}{2}}-{\sqrt {\left({\dfrac {n}{2}}\right)^{2}+\left({\dfrac {m}{3}}\right)^{3}}}}}-{\dfrac {b}{3a}}\end{matrix}}}
אם כן, מדוע מופיעים המרוכבים במכפלות בזוגות של צמודים ולא בשווה, כלומר
(
p
±
q
i
)
A
+
(
p
∓
q
i
)
B
{\displaystyle (p\pm qi)A+(p\mp qi)B}
ולא
(
p
±
q
i
)
(
A
+
B
)
{\displaystyle (p\pm qi)(A+B)}
? ההסבר פשוט:
באחת ההגדרות הראשונות למעלה קיבלנו
A
B
=
−
m
3
{\displaystyle AB=-{\frac {m}{3}}}
, ואם נכפיל
(
p
±
q
i
)
A
⋅
(
p
∓
q
i
)
B
{\displaystyle (p\pm qi)A\cdot (p\mp qi)B}
נקבל
(
p
2
+
q
2
)
A
B
{\displaystyle (p^{2}+q^{2})AB}
– מה גם שגודלו של המרוכב אכן
|
ω
1
|
=
|
ω
2
|
=
p
2
+
q
2
=
1
{\displaystyle |\omega _{1}|=|\omega _{2}|={\sqrt {p^{2}+q^{2}}}=1}
. נסו זאת.
לו נכתוב
(
p
±
q
i
)
(
A
+
B
)
{\displaystyle (p\pm qi)(A+B)}
נוכל לראות שזו תוצאה שלא פותרת את המשוואה. חד וחלק.
מספר מרוכב ו"צמוד" שלו
עד עתה פיתחנו את נוסחאות הפתרונות. למרבה הצער, לא ברור במבט ראשון כיצד נפתור את בעיית השורש השלישי של מספר מרוכב,
p
+
q
i
3
{\displaystyle {\sqrt[{3}]{p+qi}}}
.
ברור לכולנו כי הותרת הפתרון בצורה כזו אינה שימושית במיוחד.
האם הגענו למבוי סתום?
ובכן, למרבה שמחתנו התשובה שלילית. פיתוח חוקי המספרים המרוכבים משלים את אחרוני ה"חורים" בנוסחאות.
לשם כך, נתחיל להתבונן בהם כוקטורים – חצים היוצאים מראשית הצירים ופוגעים בנקודה
(
p
,
q
)
{\displaystyle (p,q)}
במישור דמוי
x
y
{\displaystyle xy}
, אשר ערכיה מקבילים לערכים הממשיים של המספר המרוכב.
כלומר, משמעות הביטוי
p
+
q
i
{\displaystyle p+qi}
היא "הליכה"
p
{\displaystyle p}
יחידות על הציר הממשי , ולאחר מכן פניה והליכה
q
{\displaystyle q}
יחידות במקביל לציר המדומה – בדיוק כתפישתנו את הגאומטריה האנליטית המוכרת לנו זה מכבר.
נביא עתה חוקים אחדים:
חלקים ממשיים ומדומים :
Re
(
z
)
=
p
,
Im
(
z
)
=
q
{\displaystyle {\text{Re}}(z)=p\ ,\ {\text{Im}}(z)=q}
סכום והפרש מרוכבים:
z
1
±
z
2
=
(
p
1
±
p
2
)
+
(
q
1
±
q
2
)
i
{\displaystyle z_{1}\pm z_{2}=(p_{1}\pm p_{2})+(q_{1}\pm q_{2})i}
כפל מרוכבים:
z
1
⋅
z
2
=
(
p
1
p
2
−
q
1
q
2
)
+
(
p
1
q
2
−
p
2
q
1
)
i
{\displaystyle z_{1}\cdot z_{2}=(p_{1}p_{2}-q_{1}q_{2})+(p_{1}q_{2}-p_{2}q_{1})i}
גודל מרוכב:
|
z
|
=
r
=
p
2
+
q
2
{\displaystyle |z|=r={\sqrt {p^{2}+q^{2}}}}
אי־שוויון המשולש :
|
z
1
+
z
2
|
≤
|
z
1
|
+
|
z
2
|
{\displaystyle |z_{1}+z_{2}|\leq |z_{1}|+|z_{2}|}
גודל כפל מרוכבים:
|
z
1
⋅
z
2
|
=
|
z
1
|
⋅
|
z
2
|
{\displaystyle |z_{1}\cdot z_{2}|=|z_{1}|\cdot |z_{2}|}
"צמוד" מרוכב:
z
¯
=
p
+
q
i
¯
=
p
−
q
i
{\displaystyle {\bar {z}}={\overline {p+qi}}=p-qi}
"צמוד" סכום והפרש מרוכבים:
z
1
±
z
2
¯
=
z
1
¯
±
z
2
¯
{\displaystyle {\overline {z_{1}\pm z_{2}}}={\overline {z_{1}}}\pm {\overline {z_{2}}}}
"צמוד" כפל מרוכבים:
z
1
⋅
z
2
¯
=
z
1
¯
⋅
z
2
¯
{\displaystyle {\overline {z_{1}\cdot z_{2}}}={\overline {z_{1}}}\cdot {\overline {z_{2}}}}
סכום והפרש מרוכב ו"צמוד":
z
±
z
¯
=
(
p
±
p
)
+
(
q
∓
q
)
i
{\displaystyle z\pm {\bar {z}}=(p\pm p)+(q\mp q)i}
כפל מרוכב ו"צמוד":
z
⋅
z
¯
=
r
{\displaystyle z\cdot {\bar {z}}=r}
הצגה קוטבית :
z
=
(
r
,
θ
)
=
r
(
cos
(
θ
)
+
sin
(
θ
)
i
)
{\displaystyle z=(r,\theta )=r{\bigl (}\cos(\theta )+\sin(\theta )i{\bigr )}}
חלקים ממשיים ומדומים:
Re
(
z
)
=
r
cos
(
θ
)
,
Im
(
z
)
=
r
sin
(
θ
)
{\displaystyle {\text{Re}}(z)=r\cos(\theta )\ ,\ {\text{Im}}(z)=r\sin(\theta )}
זוית בין המרוכב לציר הממשי (ארגומנט):
θ
=
arg
(
z
)
=
arctan
(
q
p
)
{\displaystyle \theta =\arg(z)=\arctan \left({\frac {q}{p}}\right)}
כפל מרוכבים:
z
1
⋅
z
2
=
r
1
r
2
[
cos
(
θ
1
+
θ
2
)
+
sin
(
θ
1
+
θ
2
)
i
]
{\displaystyle z_{1}\cdot z_{2}=r_{1}r_{2}{\Big [}\cos(\theta _{1}+\theta _{2})+\sin(\theta _{1}+\theta _{2})i{\Big ]}}
משפט דה־מואבר :
z
n
=
[
r
(
cos
(
θ
)
+
sin
(
θ
)
i
)
]
n
=
r
n
[
cos
(
n
θ
)
+
sin
(
n
θ
)
i
]
{\displaystyle z^{n}={\Big [}r{\bigl (}\cos(\theta )+\sin(\theta )i{\bigr )}{\Big ]}^{n}=r^{n}{\Big [}\cos(n\theta )+\sin(n\theta )i{\Big ]}}
נסו והוכיחו.
נניח ללא הגבלת הכלליות (התוצאה זהה למרוכב ול"צמוד")
w
n
=
R
n
(
cos
(
n
φ
)
+
sin
(
n
φ
)
i
)
=
r
(
cos
(
θ
)
+
sin
(
θ
)
i
)
=
z
{\displaystyle w^{n}=R^{n}{\bigl (}\cos(n\varphi )+\sin(n\varphi )i{\bigr )}=r{\bigl (}\cos(\theta )+\sin(\theta )i{\bigr )}=z}
שני מספרים מרוכבים שווים אם ערכיהם המוחלטים שווים, וגם שתי הפונקציות הטריגונומטריות הן מחזוריות – כלומר מקיימות
f
(
x
)
=
f
(
x
+
2
π
)
{\displaystyle f(x)=f(x+2\pi )}
לכל
x
{\displaystyle x}
. לכן
R
n
=
r
,
n
φ
=
θ
+
2
π
k
{\displaystyle R^{n}=r\ ,\ n\varphi =\theta +2\pi k}
אם נניח כי
θ
+
2
π
k
1
n
,
θ
+
2
π
k
2
n
{\displaystyle {\frac {\theta +2\pi k_{1}}{n}},{\frac {\theta +2\pi k_{2}}{n}}}
הם שני פתרונות שונים, נוכל להראות בקלות כי הם יבדלו זה מזה בהפרש
2
π
{\displaystyle 2\pi }
אם ורק אם ההפרש בין
k
1
,
k
2
{\displaystyle k_{1},k_{2}}
מתחלק ב־
n
{\displaystyle n}
ללא שארית.
θ
+
2
π
k
1
n
−
θ
+
2
π
k
2
n
=
2
π
⟺
k
1
−
k
2
≡
0
(
mod
n
)
{\displaystyle {\frac {\theta +2\pi k_{1}}{n}}-{\frac {\theta +2\pi k_{2}}{n}}=2\pi \ \iff \ k_{1}-k_{2}\equiv 0{\pmod {n}}}
n
{\displaystyle n}
שלם, לכן נקבל כי
0
≤
k
≤
n
−
1
{\displaystyle 0\leq k\leq n-1}
אינו מבדיל את הפתרונות ב־
2
π
{\displaystyle 2\pi }
. לבסוף
z
k
=
r
n
[
cos
(
θ
+
2
π
k
n
)
+
sin
(
θ
+
2
π
k
n
)
i
]
:
0
≤
k
≤
n
−
1
{\displaystyle z_{k}={\sqrt[{n}]{r}}\left[\cos \left({\frac {\theta +2\pi k}{n}}\right)+\sin \left({\frac {\theta +2\pi k}{n}}\right)i\right]\ :\ 0\leq k\leq n-1}