• haamanitveharochel

כמה תשובות

אין תשובה אחת

"מה הסיכוי שלי להירצח?" – שאלה שבוודאי שאלתם את עצמכם ואת המשפחה במהלך ארוחת החג האחרונה. למזלכם – יש תשובה. 0.0013% או במילים – 1.3 אלפיות אחוז (שיעור למאה אלף איש). זהו? נגמר? ברור שלא. יש עוד כמה תשובות והן מאוד שונות אחת מהשנייה: 5.3 אלפיות אחוז; 7.4 אלפיות אחוז; 16.7 אלפיות אחוז ועוד ועוד.


איך זה שיש יותר מתשובה אחת, ואיך בכלל הגענו לתשובות האלה? ולמה אתם שואלים את עצמכם כאלה שאלות מורבידיות? לא לדאוג, נענה על הכל. מלבד על השאלה האחרונה. בשביל זה יש פסיכולוג.

כמה תשובות

"כולם יודעים" שבמתמטיקה, יש רק תשובה אחת. 1+1 תמיד שווה 2 - בניגוד לספרות, היסטוריה ופוליטיקה שבהן לכל שאלה יש אין-ספור תשובות ולכל תשובה יש אין-ספור ניסוחים אפשריים.

כאשר אנחנו רואים מספרים (כמו 5.3 אלפיות אחוז), אנחנו אוטומטית עוברים ל"מצב מתמטיקה", עולם שבו לכל שאלה יש תשובה אחת ואין קשר בין מי שאתה, מה שאתה רוצה להשיג והתשובות שתתן. לכן, כאשר אנחנו רואים כמה תשובות סטטיסטיות לשאלה, אנחנו חשים לא בנוח. המהדרין מוסיפים: "שקרים קטנים, שקרים גדולים וסטטיסטיקה".


סטטיסטיקה משתמשת במספרים וסימולים מתמטיים כ"שפה", אך היא עוסקת (בד"כ) באנשים ובלא-ידוע, והתשובות שלנו לגבי הלא-ידוע תלויות במה שאנחנו כן יודעים – וכמה שאנחנו יודעים. חשוב לזכור, ככל שנדע יותר מראש, התשובה לאו דווקא תהיה מדויקת או "נכונה" יותר: לפעמים, מידע נוסף יכול דווקא להטעות אותנו ולהוביל לתשובה לא רלוונטית.


כאשר אתם שואלים "האם כדאי לקחת מטריה?", תקבלו תשובה מאוד שונה אם אתם נמצאים בירושלים, תל-אביב או לונדון וכן האם אנחנו עכשיו בחודש אוגוסט או ינואר – וזה ברור כשמש. התשובות הרבות לשאלה "מה הסיכוי שלי להירצח?" עובדות באותו אופן ותלויות במידע שכן יש לנו. גבר או אישה? באיזה גיל? איפה גר? לבן או שחור? דתי או חילוני?


הסיכוי להירצח

איך בכלל חושבים על שאלה כזו? בסטטיסטיקה, צריך גם נתונים וגם כל מיני הנחות. נתחיל עם הנתונים.

לצערי, בישראל הנתונים הגלויים בנושא חלקיים ומוגבלים.¹ בארצות הברית לעומת זאת, סוכנויות אכיפת החוק מדווחות באופן אחיד ל-FBI, שמרכיב מסדי נתונים עצומים על כל מקרי הפשיעה הידועים בארה"ב. הנתונים הם רשימה ענקית עם מאות פרטים (משתנים/עמודות) על כל מקרה. הפרטים כוללים מאפיינים הן של המקרה והן של המעורבים: מיקום, סוג הפשיעה (רצח\גניבה\אונס וכד'), כלי נשק, מין הפושעים והקורבנות, קבוצתם האתנית, האם הייתה ביניהם היכרות קודמת, ועוד. לאחר איסוף כל הדיווחים הללו, ה-FBI מייצר דו"ח שנתי בשם "פשיעה בארה"ב" הכולל כמות עצומה של טבלאות בחיתוכים שונים. כמה נרצחו בארה"ב בשנה מסוימת? כמה רוצחות ישנן לעומת רוצחים? כמה פשעי שנאה התבצעו נגד יהודים? ועוד.


אז עכשיו יש לנו נתונים. למה צריך להניח משהו? בואו ניתן לנתונים לדבר, לא?


לא. או יותר נכון – אין כזה דבר. נתונים לבדם לא אומרים כלום. או לפחות לא שום דבר בעל משמעות. בשביל תשובות עם משמעות צריך להניח הנחות. למשל – השאלה היא "מה הסיכוי שלי להירצח", אך הנתונים שיש לנו הם נתוני עבר – והשאלה היא על העתיד. צריך להניח כי העתיד יהיה מספיק דומה לעבר בשביל שהתשובה תהיה רלוונטית. כפי שניתן לראות בתרשים הבא, מי שהשתמש בשיעור הרצח בארה"ב ב-1981 בשביל לתת תשובה לסיכוי להירצח ב-2017 "פספס" את הירידה החדה בשנות ה-90 ונתן תחזית גבוהה מדי.



בנוסף, צריך להניח (ולבדוק!) שהנתונים מכילים את מה שרלוונטי לשאלתנו. בספטמבר 2001 נרצחו אלפי אנשים בפיגועי התאומים, אך פרטיהם לא מופיעים בנתוני הרצח האמריקאים שכן מדובר בפיגוע טרור – אירוע ביטחוני ולא פלילי. מצד שני, ברור שבשאלה "מה הסיכוי שלי להירצח?" היינו רוצים להתחשב גם בטרור, בטח אם אנחנו בשנת 2001 בניו-יורק.


אז את השאלה "מה הסיכוי שלי להירצח?" בעצם שינינו ל: "אם אני נמצא בארה"ב, השנה הנוכחית דומה לשנת 2017, מה הסיכוי השנתי שלי להירצח באופן פלילי ולא ביטחוני?". לא סתם את ההנחות אנחנו בד"כ לא כותבים, זה מאוד מסורבל – אבל מאוד חשוב.


אז, אם אנחנו באמריקה, מה הסיכוי שלנו להירצח? ב-2017 נרצחו 17,284 אנשים. אוכלוסיית ארה"ב באותה שנה עמדה על 325,719,178 איש. ניקח את המספר הראשון, נחלק בשני ונקבל – 5.3 אלפיות אחוז, או "5.3 קורבנות רצח לכל מאה אלף איש". זו התשובה הראשונה שלנו. אם אתם בארה"ב, אתם כנראה יודעים גם איפה בארה"ב אתם נמצאים או גרים – כדאי להשתמש במידע הנוסף הזה בשביל לקבל תשובה טובה יותר. כמו שמזג האוויר באילינוי שונה מקליפורניה, כך גם שיעור הרצח. עבור כל מדינה בארה"ב, ניקח את כמות האנשים שנרצחו ואת גודל האוכלוסייה שלה ונחשב את שיעור הרצח.

במפה הבאה אפשר לראות את שיעור הרצח לפי מדינות בתוך ארצות הברית:

ככל שהמדינה אדומה יותר – כך שיעור הרצח בה גבוה יותר. חלק מהמדינות קטנות אז קשה לראות, אבל וושינגטון הבירה (DC) מתהדרת בשיעור הרצח הגבוה ביותר בארה"ב – 16.7 נרצחים לכל מאה אלף איש. המדינה הבטוחה ביותר היא ניו המפשייר, עם שיעור רצח של 1.04 בלבד.


דיברנו קצת על מקום, מה עם מי שאתם? האם יש הבדל בסיכוי שלי להירצח אם אני גבר או אישה? אם אני ילד קטן, צעיר בין 20 ל-30 או מעל גיל 50?


נפעל בדרך מאוד דומה - ניקח את מספר הנרצחים בקטגוריה מסוימת, ונחלק בסך הכל בתוך אותה קטגוריה על מנת לקבל שיעורים. חלוקה למינים היא בד"כ מאוד קלה – שיעור הנשים והגברים באוכלוסייה עומד לרוב על (כמעט) חצי-חצי. ארצות הברית לא שונה, אך יש בה יותר נשים מגברים: 50.8% נשים. כיוון שארצות הברית היא מדינה עצומה עם יותר מ-325 מיליון איש – ההבדל הזעום הזה באחוזים משמעותו שיש בערך 5 מיליון יותר נשים מגברים בכל ארצות הברית, ועכשיו יש לכם משהו קצת פחות מורבידי לספר לחברים.


נחזור לעניינו: מתוך 17,284 נרצחים – ה-FBI מספק נתוני מין על 15,129 (גם נתונים אמריקאים הם לא מושלמים). בשנת 2017 נרצחו בארה"ב 3,222 נשים ו-11,862 גברים. נחלק את מספר הנרצחים בכל מין בכמות האנשים בכל מין ונקבל שהסיכוי גברים להירצח עומד על 7.42 אלפיות האחוז, וזה של נשים על 1.94 אלפיות האחוז. מה לגבי גיל? גם כאן ה-FBI מספק לנו נתונים מטרידים ומעניינים – בשביל לחסוך קצת במילים, יש לנו את גיל הקורבן ומפקד האוכלוסין נותן לנו גם את התפלגות הגילאים בארה"ב. ניקח את מספר הקורבנות בכל קבוצה ונחלק בגודלה וקיבלנו את התרשים הבא:


נראה שגילאי ה-20 הם המסוכנים ביותר, וזהו פתח לעוד שאלות – מדוע? מה אחראי בארה"ב לקפיצה הזו? ארחיב על כך בפוסט נפרד. אני כן רוצה להתעכב כאן על משהו שאמרנו מקודם – לפעמים יותר מידע דווקא ייתן לנו תשובה פחות טובה, ואפשר לקבל רמז לכך בגרף הגילאים. ניקח למשל מישהו בן 18. האם הסיכוי שלו להירצח בשנה הקרובה הוא 2.65 אלפיות אחוז או 10.74 אלפיות אחוז? התשובה היא שלא ברור. באופן נאיבי, הוא שייך לקבוצה של "5 עד 19" ולכן, לפי המידע שיש לנו, הסיכוי שלו הוא 2.65 אלפיות אחוז. אבל אם הוא דומה במאפיינים שלו (למשל – חבר בכנופייה) יותר לבני 20 מאשר לבני 5 עד 19, אז דווקא הקבוצה שאליה הוא לא שייך מבחינת גיל – רלוונטית יותר. במילים אחרות, לפעמים בשביל לדעת אם צריך לקחת מטריה יותר טוב לדעת אם אנחנו בחורף או בקיץ, ולא באיזו עיר בדיוק אנחנו נמצאים.


לסיכום, ראינו ש-1+1 לא תמיד שווה 2, שהעובדה שלאותה שאלה יש כמה תשובות לא אומרת שאחת מהן שגויה. שצריך לשים לב להבדל בין מה ששאלנו לבין שאלות שאפשר לתת עליהן תשובה, להיזהר מלקחת נתוני עבר ולחזות איתם בביטחון את העתיד - ואחרי כל זה, את התשובה לשאלה שאיתה פתחנו את הפוסט, ועוד כמה שאלות המשך. ואולי עכשיו תוכלו לחזור לשגרת הטיפול הרגילה אצל הפסיכולוג.


¹ שיעור הרצח בישראל ב-2017 עמד על 1.3 אלפיות האחוז. מקור: שנתון סטטיסטי 2017 – משטרת ישראל

0 צפיות

הרשמו לעדכונים במייל!