פונקציה קמורה

מתוך ויקיפדיה, האנציקלופדיה החופשית
קפיצה אל: ניווט, חיפוש
דוגמה לפונקציה קמורה

במתמטיקה, פונקציה ממשית היא פונקציה קמורה בקטע מסוים, אם לכל שתי נקודות על גרף הפונקציה (שערך ה-\,x שלהן נמצא בקטע), הקו המחבר ביניהן נמצא מעל לגרף הפונקציה (או עליו). ההגדרה שכיחה בעיקר עבור פונקציות של משתנה ממשי אחד, והדוגמה הטיפוסית היא הפונקציה \ f(x)=x^2, שהיא קמורה בכל הישר הממשי. הפונקציה נקראת קמורה כי היא תוחמת מלמטה קבוצה קמורה.

מושג הקמירות מוגדר גם לפונקציות של כמה משתנים, ובאופן כללי עבור כל פונקציה המוגדרת בתחום קמור של מרחב וקטורי ומקבלת ערכים ממשיים. לפונקציות קמורות יש חשיבות רבה באנליזה פונקציונלית, בעיקר במספר אי-שוויונות יסודיים בתחום זה כמו אי-שוויון ינסן. כאן נעסוק רק בפונקציות של משתנה אחד.

במערכת החינוך התיכוני בישראל נקראת פונקציה קמורה גם "פונקציה קעורה כלפי מעלה".

הגדרה[עריכת קוד מקור | עריכה]

כאמור לעיל, פונקציה קמורה היא כזו שהקו המחבר שתי נקודות על הגרף שלה נמצא תמיד על או מעל לגרף:

הגדרה: פונקציה \ f המוגדרת בקטע \ I נקראת קמורה אם לכל \!\, x,y\in I ולכל \!\, 0 \leq \lambda \leq 1 מתקיים אי השוויון \ f(\lambda x + (1-\lambda)y)\le \lambda f(x)+(1-\lambda)f(y).

אפשר לנסח זאת גם כך: לכל \ x<u<y בקטע, מתקיים \ (y-x)f(u)\leq (y-u)f(x)+(u-x)f(y).

מסקנות מן ההגדרה[עריכת קוד מקור | עריכה]

  • אם \ f פונקציה קמורה המוגדרת בקטע \ I אזי לכל \,x_1,x_2\ldots,x_n בקטע \ I ולכל \,n סקלרים \ \lambda_1,\lambda_2,\ldots,\lambda_n המקיימים \sum_{k=1}^n\lambda_k=1 מתקיים f(\sum_{k=1}^n\lambda_k x_k) \le \sum_{k=1}^n\lambda_k f(x_k) . (ניתן להוכיח באינדוקציה).
  • אי-שוויון ינסן מרחיב את המסקנה הקודמת למקרה הרציף: אם \ f פונקציה קמורה המוגדרת בקטע \ I ו-

\ g:[0,1]\to\mathbb{R} פונקציה אינטגרבילית אזי f(\int_0^1 g(x)\,dx)\le \int_0^1 f(g(x))\, dx.

קמירות במובן החלש ובמובן החזק[עריכת קוד מקור | עריכה]

פונקציה המקיימת את התנאי \lambda f(x)+(1-\lambda)f(y)\ge f(\lambda x + (1-\lambda)y) שתואר להלן, לכל \ x,y בקטע ולכל \ 0\leq \lambda \leq 1, היא קמורה במובן החלש. פונקציה קמורה במובן החזק היא כזו שמקיימת את התנאי החזק יותר, \ \lambda f(x)+(1-\lambda)f(y) > f(\lambda x + (1-\lambda)y) לכל \ x\neq y בקטע ולכל \ 0<\lambda<1. בדרך כלל אין מבחינים בין שני הגרסאות, וקוראים "קמורה" גם לפונקציה קמורה במובן החלש.

לדוגמה, פונקציה לינארית היא קמורה במובן החלש, וגם קעורה במובן החלש; רק פונקציה לינארית יכולה להיות קמורה וקעורה בעת ובעונה אחת (ואף זאת, במובן החלש בלבד). הוספה של פונקציה לינארית לפונקציה \,f אינה משנה את הקמירות של \,f.

קמירות בקטע וקמירות מקומית[עריכת קוד מקור | עריכה]

שלא כמו רציפות או גזירות, לקמירות אין משמעות בנקודה אחת, אלא רק בקטע. אומרים שהפונקציה קמורה מקומית ב-\,x (או קמורה בנקודה \,x), אם קיימת סביבה של \,x שבה הפונקציה קמורה.

משפט: אם הפונקציה \,f קמורה בקטעים פתוחים \ I ו- \ J שאינם זרים, אז היא קמורה גם באיחוד שלהם \ I\cup J.

הוכחה: נתונות הנקודות \ x<y\in I\cup J. צריך להוכיח שהקו המחבר את \ (x,f(x)) ל- \ (y,f(y)) נמצא מעל לגרף הפונקציה. אם שתי הנקודות \ x,y שייכות לאותו קטע I או J, התוצאה נובעת מן ההנחה על קמירות בכל קטע בנפרד. אחרת, נבחר נקודה כלשהי \ z\in I\cap J. אם הנקודה \ (z,f(z)) נמצאת מעל לקו, אפשר לבחור נקודות סמוכות מימין ומשמאל ל- \ z שנמצאות בחיתוך \ I\cap J, ולהגיע לסתירה. לכן הנקודה \ (z,f(z)) מתחת לקו, ובעזרתה אפשר להוכיח שכל נקודות הגרף נמצאות מתחת לקו.

מסקנה: אם \ f קמורה מקומית בכל נקודה בקטע סגור או פתוח \,I, אז היא קמורה בכל הקטע.

טענה זו אינה מובנת מאליה, משום שקמירות בקטע אינה מוגדרת כקמירות (מקומית) בכל נקודה שלו. מקמירות מקומית נובע שכל נקודה מוכלת בסביבה שבה הפונקציה קמורה ולכן הגרף שלה נמצא מעל הקווים שמחברים נקודות "קרובות זו לזו" בגרף - אבל לא ברור מדוע תכונה זו מתקיימת לכל שתי נקודות בקטע.

הוכחת המסקנה: ראשית נניח שהקטע סגור. אפשר לכסות אותו בקטעים פתוחים שהפונקציה קמורה בכל אחד מהם, ומכיוון שקטע סגור הוא קומפקטי, לכיסוי זה קיים תת-כיסוי סופי. כעת אפשר לסיים באינדוקציה לפי המשפט הקודם. אם הקטע פתוח, אז לכל שתי נקודות \ x,y בו קיים קטע סגור המוכל ב- \,I, ועליו חלה ההוכחה של המקרה הסגור.

הקשר בין קמירות ורציפות[עריכת קוד מקור | עריכה]

  • פונקציה ממשית הקמורה בקטע \,I רציפה בכל נקודה בפנים \,I.
  • אם סדרת פונקציות ממשיות וקמורות מתכנסת נקודתית לפונקציה \,f, אזי גם \,f פונקציה קמורה בקטע (ובפרט רציפה בפנים הקטע).

הקשר בין קמירות ונגזרת ראשונה[עריכת קוד מקור | עריכה]

  • אם \,f קמורה בקטע \,I, אזי בכל נקודה בפנים של \,I יש ל-\,f נגזרת מימין ונגזרת משמאל.
  • אם \,f גזירה בקטע פתוח, אזי \,f קמורה בו אם ורק אם הנגזרת \,f' היא פונקציה מונוטונית עולה.
  • אם \ f גזירה בסביבת הנקודה \ x_0, אז \ f קמורה ממש בסביבת \ x_0 אם ורק אם \ f(x) > f(x_0) + f'(x_0)(x-x_0) לכל \ x בסביבה. ובהתאמה אם \ f דיפרנציאבילית בסביבת הנקודה \ x_0, אז \ f קמורה ממש בסביבת \ x_0 אם ורק אם \ f(x) > f(x_0) + \langle \nabla f (x_0),(x-x_0) \rangle  לכל \ x בסביבה. זהו פיתוח טיילור מסדר ראשון.

הקשר בין קמירות ונגזרת שנייה[עריכת קוד מקור | עריכה]

הקשר בין תכונת הקמירות לנגזרת השנייה נובע מן האבחנה הבאה, שאפשר להיווכח בנכונותה על ידי הפעלה של כלל לופיטל פעמיים: אם הפונקציה \,f גזירה פעמיים בנקודה \,x, אז

\ \lim_{h \rightarrow 0}\frac{(\beta-\alpha)f(x+\gamma h)-(\gamma-\alpha)f(x+\beta h)+(\gamma-\beta)f(x+\alpha h)}{h^2}


= \frac{(\beta-\alpha)(\gamma-\beta)(\gamma-\alpha)}{2}f''(x),

וזאת לכל \ \alpha,\beta,\gamma קבועים. אם \ \alpha<\beta<\gamma, כפי שנניח מעתה, אז המקדם באגף ימין הוא חיובי.

משפט: אם \,f גזירה פעמיים ב-\,x וקמורה (במובן החלש) בסביבה של \,x, אז \ f''(x)\geq0 (מן הקמירות נובע שהמונה באגף שמאל של הזהות הוא חיובי, ולכן הגבול אינו שלילי).

מכאן נובעת מיד

מסקנה: אם \,f גזירה פעמיים בקטע, וקמורה שם (במובן החלש), אז \ f''(x)\geq0 בכל הקטע.

בכיוון ההפוך:

משפט: אם \,f גזירה פעמיים בקטע והנגזרת השנייה מקיימת \ 0 \leq f''(x) בכל הקטע, אז הפונקציה קמורה בקטע (במובן החלש). בנוסף לזה, אם \ 0 < f''(x) בכל הקטע (או אפילו: הנגזרת השנייה אי-שלילית, ומתאפסת במספר סופי של נקודות), אז הפונקציה קמורה בקטע במובן החזק.

הוכחה: נסמן ב- \ a<b את קצות הקטע. מספיק להראות שהגרף של \ f נמצא מתחת לקו המחבר את הנקודות המתאימות ל- \ x=a ו- \ x=b על הגרף, משום שאז אפשר להפעיל את אותו נימוק על כל זוג נקודות בתוך הקטע. נתבונן בפונקציה \ g(x)=f(x)-f(a)-\frac{f(b)-f(a)}{b-a}(x-a), שהיא קמורה באותם מקומות בהם \ f קמורה (משום שההפרש ביניהן הוא פונקציה לינארית). קל לבדוק ש- \ g(a)=g(b)=0. נניח בשלילה שיש נקודה \ a<z<b שעבורה \ g(z)\geq 0; אז לפי משפט הערך הממוצע של לגראנז' קיימת נקודה בקטע \ (a,z) שבה הנגזרת \ g' אי-שלילית, וקיימת נקודה בקטע \ (z,b) שבה הנגזרת אי-חיובית. אבל לפי הנחת המשפט, הנגזרת היא פונקציה עולה (במובן החזק). ההוכחה למקרה של אי-שוויון חלש דומה.

מסקנה: אם \ f'' רציפה בנקודה וחיובית שם, אז \ f קמורה בסביבה של הנקודה (במובן החזק). הוכחה: מן הרציפות נובע שהנגזרת השנייה חיובית בסביבה של \ x.

לסיכום, בתחום שבו הפונקציה גזירה פעמיים מתקיים:

\ 0 \leq f'' \iff הפונקציה קמורה במובן החלש \implies הפונקציה קמורה במובן החזק \implies \ 0 < f''.

פונקציה קמורה בחצייה[עריכת קוד מקור | עריכה]

הגדרה: פונקציה \ f המוגדרת בקטע \ I נקראת קמורה בחצייה (midconvex או Jensen-convex) אם לכל \!\, x,y\in I מתקיים אי השוויון \ f(\frac{x+y}{2})\le \frac{1}{2} \left(f(x)+f(y)\right).
  • ברור כי כל פונקציה קמורה היא פונקציה קמורה בחצייה.
  • לא כל פונקציה קמורה בחצייה היא פונקציה קמורה. ניתן לבנות דוגמה לפונקציה קמורה בחצייה שאינה קמורה באופן הבא:
נשלים את הקבוצה \,\{1\} לבסיס המל \,B של \mathbb{R} כמרחב וקטורי מעל \mathbb{Q}. נגדיר פונקציה ממשית \,f באופן הבא: \,f(x)=1 לכל \,x\in B ונרחיב באופן לינארי על כל \mathbb{R}. הפונקציה שהתקבלה היא העתקה לינארית ב-\mathbb{R} כמרחב וקטורי מעל \mathbb{Q}, ולכן מתקיים \ f(\lambda x + (1-\lambda)y) = \lambda f(x)+(1-\lambda)f(y) לכל \lambda\in\mathbb{Q}, מכאן שהפונקציה קמורה בחצייה. בנוסף, כטרנספורמציה לינארית מתקיים \,f(0)=0, וכן \,f(\lambda)=\lambda f(1)=\lambda לכל \lambda\in\mathbb{Q}. אולם הפונקציה \,f אינה רציפה, משום שעל הרציונלים היא לינארית, אך מקבלת את הערך 1 אינסוף פעמים. מכאן שהפונקציה אינה קמורה כי פונקציה קמורה היא בהכרח רציפה (ראו לעיל).
  • פונקציה קמורה בחצייה ורציפה היא פונקציה קמורה. (מכאן שפונקציה המוגדרת בקטע פתוח היא קמורה אם ורק אם היא קמורה בחצייה ורציפה).
  • פונקציה קמורה בחצייה וחסומה היא פונקציה קמורה.

שתי הטענות לעיל הן מקרים פרטיים של המשפט שהוכח באופן בלתי תלוי על ידי בלומברג וואצלב שרפינסקי:

  • פונקציה קמורה בחצייה ומדידה היא פונקציה קמורה.

פונקציה קעורה[עריכת קוד מקור | עריכה]

\,f היא פונקציה קעורה אם הקו המחבר כל שתי נקודות על הגרף עובר תמיד מתחת לגרף, כלומר הפונקציה הנגדית \ -f קמורה. מכאן שהנגזרת השנייה מאפשרת להכריע בין קמירות לקעירות: בקטעים שבהם הנגזרת השנייה חיובית הפונקציה קמורה (במובן החזק), ובקטעים שבהם היא שלילית הפונקציה קעורה. הנקודות שבהן הפונקציה עוברת מקמירות לקעירות או להפך (ולכן הנגזרת השנייה מתאפסת, אם היא מוגדרת בסביבת הנקודה) נקראות נקודות פיתול.

פונקציה לוג-קמורה[עריכת קוד מקור | עריכה]

פונקציה חיובית \ f המוגדרת בקטע \ I נקראת פונקציה לוג-קמורה אם \ \log f היא פונקציה קמורה בקטע \ I (\ I הוא קטע כלשהו, סופי או אינסופי). אם \ f גזירה פעמיים, תנאי זה שקול לכך ש-\ f(x)f''(x)\geq f'(x)^2. לדוגמה, הפונקציות \ f(x)={\rm e}^{x^2} ופונקציית גמא הן לוג-קמורות.

קל לראות שפונקציה לוג-קמורה היא קמורה, אך ההפך אינו נכון. לדוגמה, הפונקציה \ f(x)=x^2 קמורה, אבל \ \log f(x)=2\log x אינה קמורה.

ראו גם[עריכת קוד מקור | עריכה]