במהלך מלחמת העולם השנייה נעשו מאמצים ממושכים על ידי בעלות הברית כדי לקבוע את היקף הייצור הגרמני, וניסו לפתור זאת בשתי גישות: באמצעות איסוף מודיעין בצורה קונבנציונלית ובאמצעות אמידה סטטיסטית. במקרים רבים הניתוח הסטטיסטי עלה באיכותו על המודיעין הקונבנציונלי. במקרים מסוימים נעשה שימוש במודיעין קונבנציונלי בצירוף ניתוח סטטיסטי, כמו במקרה של הערכת ייצור טנקי הפנתר לפני הפלישה לנורמנדי.
הפיקוד של בעלות הברית סבר כי טנקי פנצר סימן 5 (פנתר) שנצפו באיטליה, שלהם מהירות גבוהה ותותחי 75 מ"מ/L70, הם טנקים כבדים נדירים במיוחד, ויהיו רק במספר קטן בצפון צרפת, באופן דומה לטנקי הטיגר I שנצפו בתוניסיה. צבא ארצות הברית היה משוכנע כי טנקי שרמן ימשיכו לתפקד היטב, כפי שתפקדו נגד טנקי פנצר סימן 3 ופנצר סימן 4 בצפון אפריקה ובסיציליה.
זמן קצר לפני הפלישה לנורמנדי הגיעו שמועות על כך שהגרמנים עושים שימוש במספר גדול של טנקים מסוג פנצר סימן 5. כדי לברר את נכונות השמועות, ניסו בעלות הברית להעריך את מספר הטנקים שיוצרו. הם ביססו את הערכותיהם על המספרים הסידוריים של טנקים שנתפסו או נהרסו. המספרים העיקריים ששימשו לניתוח זה היו מספרים סידוריים של תיבות ההילוכים, מאחר שאלו פוצחו על ידי בעלות הברית. מספרי השלדה והמנוע שימשו אף הם לניתוח, אך השימוש בהם היה מסובך יותר. מידע מרכיבים נוספים שימש לביסוס נוסף של הניתוח. ניתוח דומה נעשה גם על פי מספרים סידוריים של גלגלי מרכוב, שלהם ניתנו מספרים ברצף (1, 2, ...N).
ניתוח גלגלי הטנקים הניב ההערכה של מספר סוגי הגלגלים שהיו בשימוש. בדיקות שנעשו יחד עם מומחים בריטיים לייצור גלגלים העריכו את מספר הגלגלים שניתן היה לייצר מסוגים אלו, וכך את מספר הטנקים המיוצרים מדי חודש. ניתוח של גלגלים משני טנקים (בכל אחד מהם 32 גלגלים) הוביל להערכה של 270 טנקים שיוצרו בפברואר 1944.
ממסמכים גרמניים שנתפסו לאחר המלחמה התברר כי מספר הטנקים שיוצרו בפברואר 1944 היה 276 טנקים. הניתוח הסטטיסטי התברר כמוצלח יותר מהערכות המודיעין הקונבנציונליות, ו"בעיית הטנק הגרמני" הפך לשם שגור לתיאור בעיות מסוג זה.
השימוש במספרים סידוריים ובניתוחים סטטיסטים לא היה מוגבל רק להערכת מספר הטנקים, ושימש את בעלות הברית גם להערכת הייצור הגרמני באופן כללי, ובפרט מספר המפעלים וחשיבותם, אורך שרשרת האספקה (הזמן מהייצור ועד הכנסה לשימוש), שינויים בייצור ושימוש במשאבים כדוגמת גומי.
על פי הערכות המודיעין הקונבנציונלי של בעלות הברית, ייצרו הגרמנים בסביבות 1,400 טנקים מדי חודש בין יוני 1940 לספטמבר 1942. אבל תוך שימוש בניתוח הסטטיסטי שיוצג להלן, הוערך מספר הטנקים שיוצרו ב-246 מדי חודש בלבד.[1] לאחר המלחמה, מסמכים עם פרטי הייצור שנתפסו ממשרדו של אלברט שפר הראו כי המספר האמיתי היה 245.
ניתוחים סטטיסטיים דומים נעשו על פי מספרים סידוריים גם בהקשר לציוד צבאי אחר במלחמת העולם השנייה, ובפרט לטילי V-2. במהלך מלחמת העולם השנייה העריך הצבא הגרמני את היקף הייצור הצבאי הסובייטי, ובמהלך מלחמת קוריאה, נעשה ניתוח של מספרים סידוריים של ציוד סובייטי. גם ברית המועצות העריכה את ייצור הטנקים הגרמניים באופן דומה במהלך מלחמת העולם השנייה.
בשנות ה-80 מספר אמריקאים קיבלו גישה לקווי הייצור של טנקי מרכבה. היקף הייצור סודי, אך לטנקים היו מספרים סידוריים, שאפשרו להעריך את היקף הייצור שלהם.[3]
אינטואיטיבית האומד הוא המקסימום במדגם ועוד ההפרש הממוצע בין התצפיות במדגם. המקסימום במדגם נבחר כאומד ראשוני מאחר שהוא אומד נראות מקסימלית, והוספת ההפרש מפצה על ההטיה מטה של המקסימום במדגם לעומת המקסימום באוכלוסייה כולה.
אם m הוא המקסימום במדגם, ו-k הוא מספר הדגימות, הנוסחה תהיה:
ניתן להמחיש זאת בכך שהדוגמאות נמצאות בהפרש קבוע ביניהן בתוך הטווח, ודוגמאות נוספות נמצאות ממש מעבר לטווח של 0 ו N+1. אם מתחילם בהפרש ראשוני של בין 0 למינימום במדגם הפרש הממוצע בין הדוגמאות הוא ; ההחסרה של נעשית משום שהדוגמאות עצמן אינן נספרות בהפרש בין הדוגמאות.
הרעיון שבבסיס תיאור זה מנוסחות בצורה פורמלית באמצעות אמידת רווח מקסימלי (maximum spacing estimation)(אנ').
עבור אמידה נקודתית (אמידת נקודה יחידה מסה"כ ), אומד חסר הטיה בעל שונות מינימלית (minimum-variance unbiased estimator; MVUE) ניתן באמצעות:
כאשר m הוא המספר הסידורי הגבוה ביותר שנצפה ו-k הוא מספר התצפיות. כאשר מרגע שנצפה מספר סידורי מסוים, הוא לא יצפה בשנית. לכך יש שונות:
כך שסטיית התקן היא בערך N/k, הגודל הממוצע (של האוכלוסייה) של ההפרש בין הדוגמאות; בהשוואה ל m/k לעיל.
הגישה הבייסיאנית לבעיית הטנק הגרמני היא לבחון את ההסתברות של כך שמספר הטנקים של האויב N שווה ל־n, מספר הטנקים שנצפו K שווה ל־k והמספר הסידורי הגבוה ביותר שנצפה M הוא m. לשם הקיצור נשתמש ב־ לציון .
מכללים של הסתברות מותנת מקבלים:
הנוסחה היא ההסתברות המותנית שהמספר הסידורי הגבוה ביותר שנצפה הוא כאשר ידוע שמספר הטנקים של האויב הוא ו־ טנקים נצפו:
כאשר המקדם הבינומי הוא מספר הקבוצות של דוגמאות בגודל מאוכלוסייה של .
הביטוי הוא ההסתברות שהמספר הסידורי המרבי הוא m כאשר k טנקים נצפו, אך לפני שנצפו המספרים הסידוריים. את ניתן לכתוב מחדש במונחים של יתר הנתונים באמצעות סכימה באמצעות האפשרויות השונות של :
הביטוי מתאר את ההסתברות לכך שמספר הטנקים הכולל הוא n כאשר k טנקים נצפו אך לפני צפייה במספרים הסידוריים. בהנחה שההתפלגות היא התפלגות אחידה (בדידה):
החסם העליון חייב להיות סופי כיוון שהפונקציה: תקבל ואינה פונקציית הסתברות. לכן:
אם אז המשתנה מוסר מהנוסחה.
עבור השכיח של ההתפלגות של מספר הטנקים של האויב הוא m.
עבור ההסתברות שמספר הטנקים שווה ל־n היא:
וההסתברות שמספר הטנקים של האויב, , הוא גדול מ־, היא:
תצפית בטנק יחיד באקראי מתוך אוכלוסייה של n טנקים, ולו מספר סידורי m בהסתברות של עבור ובהסתברות של אפס עבור .
. באמצעות שימוש בסוגרי אייברסון ניתן לכתוב זאת:
נניח כי קצין מודיעין צפה בארבעה טנקים בעלי מספרים סידוריים 2, 6, 7 ו-14. נסמן את מספר הטנקים בהם צפה ב- ואת המספר הסידורי המרבי שנצפה ב-. מספר הטנקים של האויב, שאותו נסמן ב-, אינו ידוע ואותו רוצים להעריך על פי תצפיות אלו.
הערכה למספר הטנקים של האויב על פי הגישה השכיחותית:
לעומת זאת הערכה בייסיאנית של מספר הטנקים:
ועל פי ההערכה זו נוכל לאמוד את מספר הטנקים כך:
להתפלגות זו צידוד חיובי, הקשור לכך שמספר הטנקים אינו קטן מ-14.