משוואה דיפרנציאלית לינארית

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש

במתמטיקה, משוואה דיפרנציאלית לינארית היא משוואה דיפרנציאלית רגילה בפונקציה הנעלמת \ y=y(x), שאפשר להציג בצורה \ y^{(n)}+p_{n-1}(x)y^{(n-1)}+\dots+p_1(x)y'+p_0(x)y=g(x), כאשר \ p_{n-1},\dots,p_0,g הן פונקציות של המשתנה \ x בלבד. בניגוד למרבית טיפוסי המשוואות הדיפרנציאליות, למשוואות הלינאריות יש תאוריה מפותחת וטכניקות פתרון שיטתיות, והן מופיעות בתחומי מדע רבים.

רישום בצורה אופרטורית[עריכת קוד מקור | עריכה]

משוואה דיפרנציאלית היא בעלת סדר \ n אם מופיעה בה הנגזרת ה-n-ית \ y^{(n)}, אבל לא הנגזרת הבאה, \ y^{(n+1)}.

ניתן לרשום את המשוואה בצורה מקוצרת אם מגדירים אופרטור כך: \ L=\frac{d^n}{dx^n}+p_{n-1}\frac{d^{n-1}}{dx^{n-1}}+\dots+p_0, ואז המשוואה נרשמת כך: \ L\left[y\right]=g(x). המשוואה נקראת "לינארית" שכן אופרטור זה הוא לינארי: \ L\left[\lambda_1 y_1+\lambda_2 y_2\right]=\lambda_1 L\left[y_1\right]+\lambda_2 L\left[y_2\right].

אם \ g(x)\equiv 0 המשוואה נקראת הומוגנית.

פתרון משוואות לינאריות[עריכת קוד מקור | עריכה]

באופן כללי, פונקציות רבות יכולות להיות פתרון של אותה משוואה. לפונקציה מסוימת שהיא פתרון של המשוואה נקרא "פתרון פרטי" של המשוואה. עבור משוואה הומוגנית \ L\left[y\right]=0 סכום של כל שני פתרונות הוא פתרון וכפל בסקלר של פתרון הוא פתרון. לכן אוסף הפתרונות של משוואה לינארית הומוגנית הוא מרחב וקטורי ויש לו בסיס, כלומר קבוצת פונקציות \ y_1,\dots,y_n כך שכל פתרון של המשוואה ההומוגנית יכול להיכתב כצירוף לינארי שלהן: \ y=c_1 y_1+\dots+c_n y_n. עבור בסיס של מרחב הפתרונות, נקרא לצירוף הלינארי \ c_1 y_1+\dots+c_n y_n, כאשר \ c_1,\dots,c_n הם קבועים, "פתרון כללי של המשוואה ההומוגנית".

למשוואה לינארית \ L\left[y\right]=g(x) התכונה שהפרש של כל שני פתרונות של המשוואה הוא פתרון של המשוואה ההומוגנית \ L\left[y\right]=0. אכן, אם \ L\left[y_1\right]=L\left[y_2\right]=g(x) אז \ L\left[y_1-y_2\right]=L\left[y_1\right]-L\left[y_2\right]=g(x)-g(x)=0. מכאן נובעת תכונה חשובה של משוואות לינאריות:

כל פתרון של משוואה לינארית ניתן לכתיבה כסכום של פתרון פרטי של המשוואה הלינארית, ופתרון כללי של המשוואה ההומוגנית המתאימה לה.

תכונה זו ברורה באופן מיידי: אם \ y הוא פתרון כלשהו של המשוואה, ו- \ y_p הוא הפתרון הפרטי שאנו משתמשים בו, אז ההפרש \ y-y_p, כפי שראינו, הוא פתרון של המשוואה ההומוגנית, וכל פתרון של המשוואה ההומוגנית ניתן לביטוי באמצעות הפתרון הכללי של המשוואה ההומוגנית.

מכאן נובע שכדי לפתור בצורה כללית משוואה לינארית לא הומוגנית יש לעשות שני דברים:

  1. לפתור את המשוואה ההומוגנית המתאימה לה.
  2. למצוא פתרון פרטי אחד למשוואה הלא הומוגנית.

קיימת שיטה בשם "וריאציית הפרמטר", המאפשרת למצוא בצורה שיטתית פתרון פרטי למשוואה הלא הומוגנית בהינתן הפתרון הכללי של המשוואה ההומוגנית. עם זאת, השיטה עלולה לכלול עבודה טכנית רבה, ונדרשת בה אינטגרציה שבה לא בהכרח ניתן לבטא את התוצאה בצורה מפורשת. שיטה אחרת, הנקראת "השוואת המקדמים" מבוססת על ניחוש מושכל של צורת הפתרון הפרטי והשימוש בה הוא פשוט ונוח, אך היא טובה רק למקרים מסוימים.

באופן כללי אין פתרון שיטתי פשוט למשוואה לינארית הומוגנית. עם זאת, אם ידוע פתרון אחד של המשוואה, ניתן לקבל ממנו פתרון נוסף, שאינו תלוי בו. שיטה זו ידועה בשם "שיטת ד'אלמבר להורדת סדר המשוואה". כמו כן, במקרה הפרטי המיוחד שבו המקדמים \ p_{n-1},\dots,p_0 הם כולם קבועים קיים פתרון שיטתי המתבסס על מה שמכונה "המשוואה האופיינית" (או: "הפולינום האופייני") של המשוואה הלינארית.

משוואה הומוגנית במקדמים קבועים[עריכת קוד מקור | עריכה]

תהא \ y^{(n)}+A_{n-1}y^{(n-1)}+\dots+A_1 y=0 משוואה לינארית הומוגנית כאשר כל המקדמים \ A_{n-1},\dots,A_1 הם מספרים קבועים. הפתרון \ y=0 הוא טריוויאלי, ואנו רוצים למצוא פתרונות נוספים. מכיוון שכל המקדמים קבועים, יהיה נוח לחפש פתרון שהוא פונקציה שהשינוי היחיד שהיא עוברת במהלך גזירתה הוא כפל בקבוע. זוהי בדיוק פונקציית האקספוננט: \ y=e^{\lambda x} כאשר \ \lambda הוא קבוע שאנו רוצים למצוא. נשים לב כי \ y^{(k)}=\lambda^k e^{\lambda x}. לכן, לאחר הצבת הפתרון המשוער, נקבל:

\ \lambda^n e^{\lambda x}+A_{n-1}\lambda^{n-1} e^{\lambda x}+ \dots +A_1\lambda e^{\lambda x}=0.

ניתן לצמצם ב-\ e^{\lambda x} כי פונקציה זו תמיד שונה מאפס. נקבל:

\ \lambda^n +A_{n-1}\lambda^{n-1} + \dots +A_1\lambda =0.

זוהי משוואה בנעלם \ \lambda הנקראת המשוואה האופיינית של המשוואה הדיפרנציאלית שלנו. לא תמיד ניתן למצוא לה פתרונות בצורה מפורשת (תורת גלואה מוכיחה כי למשוואה ממעלה חמישית ומעלה לא קיים פתרון כללי הנתון על ידי נוסחה), אך קיימות שיטות למציאת פתרונות מקורבים, דוגמת שיטת ניוטון-רפסון. המשפט היסודי של האלגברה מבטיח עבור משוואה ממעלה \ n שקיימים לה \ n שורשים (לא בהכרח שונים זה מזה, אך בעלי ריבוי כולל של \ n).

לעתים בוחרים להסתכל על אגף שמאל של המשוואה בתור פולינום ב-\ \lambda, ולהציג את הבעיה כבעיה של מציאת שורשי הפולינום, הנקרא הפולינום האופייני של המשוואה הדיפרנציאלית. שתי הבעיות זהות לגמרי.

יהא \ \alpha שורש של הפולינום (כלומר, פתרון של המשוואה). אז \ e^{\alpha x} הוא פתרון של המשוואה, כפי שנובע מהניחוש שלנו.

ייתכן כי \ \alpha הוא שורש מריבוי גדול מאחד, ואז כל פונקציה מהצורה \ x^k e^{\alpha x}, כאשר \ k הוא מספר טבעי הקטן מריבוי השורש, היא פתרון של המשוואה שאינו תלוי בשאר הפתרונות שהתקבלו בדרך זו. כך עבור משוואה מסדר \ n ניתן לקבל \ n פתרונות בלתי תלויים.

אם כל מקדמי המשוואה הם ממשיים וחלק מהשורשים שיתקבלו הם מרוכבים, ניתן לקבל מכל פתרון מרוכב פתרון ממשי, שאינו כולל מספרים מרוכבים, בצורה זו: מכיוון שכל מקדמי המשוואה ממשיים, מספר מרוכב הוא פתרון שלה רק אם גם הצמוד שלו הוא פתרון שלה. נניח כי \ \alpha+i\beta,\alpha-i\beta הם שני פתרונות שכאלו. אז הפונקציות המתאימות להם הן \ e^{(\alpha+i\beta)x}=e^{\alpha x}\cdot e^{i\beta x},e^{(\alpha-i\beta)x}=e^{\alpha x}\cdot e^{-i\beta x}.

כעת, בהסתמך על העובדה שסכום וכפל בקבוע של פתרונות גם הוא פתרון, נקבל שני פתרונות ממשיים על ידי שימוש בנוסחת אוילר:

\ e^{\alpha x} \frac{e^{i\beta x}+e^{-i\beta x}}{2}=e^{\alpha x}\cos(\beta x),
e^{\alpha x} \frac{e^{i\beta x}-e^{-i\beta x}}{2i}=e^{\alpha x}\sin(\beta x)
.

ניתן להוכיח על ידי בדיקה (למשל באמצעות הורונסקיאן) כי אלו פתרונות בלתי תלויים.

שיטת ד'אלמבר להורדת סדר המשוואה[עריכת קוד מקור | עריכה]

נתונה משוואה לינארית הומוגנית כללית (כלומר, המקדמים הם פונקציות של \ x ולא בהכרח קבועים). נניח כי ידוע לנו פתרון לא טריוויאלי אחד של המשוואה, ואנו רוצים למצוא פתרון נוסף, בלתי תלוי בו. הגיוני לחפש פתרון שיהיה דומה בצורתו לפתרון הקיים, וההבדל ביניהם מתבטא בכפל בפונקציה לא ידועה כלשהי. לכן נסמן \ y_2(x)=y_1(x)v(x) כאשר \ v(x) היא פונקציה בלתי ידועה ו-\ y_1 הוא הפתרון שידוע לנו. כעת נציב את הפתרון החדש למשוואה ונחלץ את \ v(x). אם נצליח, קיבלנו פתרון נוסף, \ y_1(x)v(x).

נדגים את התהליך עבור משוואה לינארית ממעלה שנייה: \ y''+p(x)y'+q(x)y=0. נניח שנתון פתרון לא טריוויאלי \ y_1 ואנו מנחשים פתרון \ y_2=y_1\cdot v. נחשב את הנגזרת הראשונה והשנייה של הפתרון:

\ y_2'=y_1'v+y_1v'
\ y_2''=y_1''v+2y_1'v'+y_1v''.

נציב במשוואה המקורית ונקבל:

\ y_1''v+2y_1'v'+y_1v''+p(x)(y_1'v+y_1v')+q(x)y_1v.

לאחר פתיחת סוגריים והוצאת גורם משותף נקבל:

\ v(y''+p(x)y_1'+q(x)y_1)+v'(2y_1'+p(x)y_1)+v''y_1=0.

נשים לב כי הביטוי בסוגריים השמאליים מתאפס, כי \ y_1. הוא פתרון של המשוואה הלינארית (ולכן \ y_1''+p(x)y_1'+q(x)y_1=0) לכן בסך הכול קיבלנו:

\ v'(2y_1'+p(x)y_1)+v''y_1=0.

כעת ניתן להציב \ t=v' ולקבל אחרי חילוק ב-\ y_1 (מותר לנו כי על פי משפט הקיום והיחידות, אם \ y_1 מתאפס בנקודה כלשהי הוא חייב להיות הפתרון הטריוויאלי \ y=0) את המשוואה \ t'+(2\frac{y_1'}{y_1}+p(x))t=0. זוהי משוואה לינארית מסדר ראשון, כלומר הורדנו את סדר המשוואה.

פתרון של משוואה זו נתון על ידי

\ t=\exp(-\int(2\frac{y_1'}{y_1}+p(x))dx)=\exp(-\int p(x)dx-2\ln(y_1))= e^{-\int p(x)dx}\cdot e^{\ln(y_1^{-2})}=\frac{e^{-\int p(x)dx}}{y_1^2}

כדי למצוא את הפתרון השני של המשוואה יש לעבור מ-\ t ל-\ v על ידי אינטגרציה נוספת, ולבסוף לכפול ב-\ y_1. נקבל את התוצאה הסופית:

\ y_2=y_1\cdot\int\frac{e^{-\int p(x)dx}}{y_1^2}.

ישנן דרכים נוספות להגיע לנוסחה זו, איך היתרון בדרך שהוצגה כאן הוא שאין היא מצריכה זכירת נוסחאות או משפטים, אלא רק שבהינתן פתרון \ y_1 כלשהו ניתן למצוא פתרון נוסף הנתון על ידי הצורה \ y_1v, גזירתו והצבתו במשוואה.

נשים לב כי שיטה זו אינה מבטיחה שהפתרון הנוסף יהיה ניתן לכתיבה על ידי פונקציות אלמנטריות: אין זה מובטח שניתן יהיה למצוא פתרון לשני האינטגרלים שבנוסחא. עם זאת, כאשר פונקציה מוצגת על ידי אינטגרלים לרוב קל יותר לעבוד איתה מאשר במצב שבו הצגתה היחידה היא על ידי משוואה דיפרנציאלית.

המקרה הכללי[עריכת קוד מקור | עריכה]

ניתן להכליל את השיטות וההגדרות למשוואה דיפרנציאלית בפונקציות וקטוריות כלומר המשוואה מהצורה:

\frac{d}{dx} \vec y (x) = A(x) \cdot \vec y (x) + \vec b (x) כאשר \vec b , \ \vec y : \mathbb{R} \to \mathbb{R}^n, ו- A היא מטריצה של פונקציות ממשיות.

אפשר להציג את y במפורש כוקטור שרכיביו הן פונקציות ממשיות גזירות, ולקבל מערכת של משוואות דיפרנציאליות עם n פונקציות נעלמות- \ y_1 , . . . y_n. בהמשך החלק נוותר על סימון החץ מעל הפונקציה y, כאשר ההקשר יהיה ברור.

שיטות כלליות[עריכת קוד מקור | עריכה]

כמו בפתרון הבעיות הרגילות, גם בממדים גבוהים אוסף כל הפתרונות של משוואה דיפרנציאלית לינארית הוא מרחב וקטורי, וממדו הוא ממד הווקטור y. כדי לייצג את מרחב הפתרונות באופן קומפקטי משתמשים במטריצה של פונקציות \ \Phi (x), שהיא הפיכה לכל t בתחום הפתרון של המשוואה, ומקיימת את השוויון \ \Phi '(x) = A(x) \Phi (x). מטריצה זו נקראת המטריצה היסודית של המשוואה, או המטריצה הפונדמנטלית. באמצעות מטריצה זו ניתן להציג כל פתרון של המשוואה ההומוגנית, \ y' = Ay, כיוון שכל פתרון כזה מתקבל על ידי כפל של וקטור קבוע במטריצה היסודית. פתרונות של המשוואה הלא הומוגנית \ y' = Ay + b מתקבלים על ידי כפל של המטריצה היסודית בוקטור של פונקציות גזירות שמקיים את המשוואה \ \Phi (x) c'(x) = b(x).

נפתור קודם כל את המקרה הפשוט ביותר: \ y' = ay , \ \ y(0)=b כאשר y פונקציה רגילה מהממשיים לעצמם. נשתמש באיטרציות של פיקאר כדי לפתור את המשוואה הזו:

\varphi_0 (x) = b
\varphi _1 (x) = b + \int_{0}^x a\varphi_0 (t) \, dt = (1+ax)b
\varphi _{n+1} (x) = b + \int_{0}^x a\varphi _n (t) \, dt = b + \int_{0}^x a\cdot \left( \sum_{k=0}^n \frac{a^k t^k}{k!} \right) b \, dt = \left( \sum_{k=0}^{n+1} \frac{a^k x^k}{k!} \right) b

כאשר את המעבר השני אפשר להוכיח באינדוקציה. קל לראות שהאיטרציות מתכנסות לפונקציה \ y = e^{ax} b, שפותרת את המשוואה. בצורה דומה, ניתן לראות שהפתרון הכללי עבור תנאי התחלה \ y(\tau ) = b הוא:

y = e^{(t-\tau ) a} \cdot b

למעשה, אותה שיטה בדיוק יכולה לפתור גם את המשוואה הדיפרנציאלית \ y' = A y כאשר A מטריצה ריבועית. על ידי האיטרציות של פיקאר מתקבל, כמו קודם, שהפתרון למשוואה עם תנאי ההתחלה \ y(\tau ) = b הוא הגבול:

\ y = \lim_{n \to \infty } \sum_{k=0}^n \frac{(x - \tau )^n A^n}{n!} \cdot b = \sum_{k=0}^\infty \frac{ \left( (x - \tau)A \right) ^n}{n!} \cdot b = \ e^{(x - \tau ) A} \cdot b

האיבר האחרון בשיוויונות הוא האקספוננט המטריציאלי של המטריצה \ (x - \tau ) A מוכפל בוקטור b. המטריצה \ \Phi (x) = e^{ x A } היא מטריצה יסודית של המשוואה.

באופן דומה למקרה הכללי, אפשר להראות שהמטריצה היסודית שמתאימה למשוואה \ y' = A(x) y היא המטריצה \ e^{ \int A(x)dx }.

רדוקציה למשוואה מסדר n[עריכת קוד מקור | עריכה]

כל משוואה לינארית מסדר n ניתנת להצגה כמערכת של n משוואות לינאריות על ידי המעבר הבא: אם \ y^{(n)}+p_{n-1}(x)y^{(n-1)}+\dots+p_1(x)y'+p_0(x)y=g(x)

\ y=y_1
\ y_1 ' = y_2
.
.
\ y_{n-1} ' = y_n
\ y_n ' = -p_{n-1}(x)y_n - \dots - p_1(x) y_2 - p_0 (x) y_1 + g(x)

המשוואה האחרונה מתקבלת מהמשוואה המקורית \ y^{ (n) } = -(\ p_{n-1}(x)y^{(n-1)}+\dots+p_1(x)y'+p_0(x)y\ ) + g(x) על ידי ההחלפה \ y^{ (k) } = y_{k+1}.

באופן הזה מתקבלת מערכת משוואות לינאריות שפתרונה שקול לפתרון המשוואה המקורית.