מחשבות שנוגעות למערכות מידע, וגם כאלה שלא…

בחירות 2019, בואינג 737 מקס ואמינות נתונים

שלוש פעמים התחלתי לכתוב את הפוסט הזה, שלוש פעמים החלטתי שהוא לא לעניין.
זו הפעם הרביעית, והוא לגמרי לעניין!!!

אמינות נתונים

נתחיל בהיסטוריה קצרה, שלא לומר נוסטלגיה.
זה קרה לפני כ-20 שנה, כשהייתי אחראי על מאגר מידע גדול, מרכזי ורגיש. זו היתה מערכת ותיקה, עתיקה, ובאותה נשימה גם אמינה ויציבה, אבל היא היתה קצת לא ידידותית, וממש לא "מודרנית". המסכים היו מסכי טקסט, ללא שום גרפיקה ובעצם גם ללא צבע. מסך שחור-ירוק של מלל.

באותה תקופה פיתחו מערכת מודרנית שמתממשקת למערכת הליבה. זו היתה מערכת גרפית, חלונאית, בסטנדרטים ושפת פיתוח שמתאימים לתקופה. הרציונל היה לתפור "פנים יפות" למשתמשי הקצה, תוך שמירת המידע הקובע במערכת המרכזית, אך גם לאפשר עבודה במצב נתק מהמערכת המרכזית, כי איכות התקשרות לא תמיד היתה טובה.

פיתוח המערכת בוצע בענף אחר, אשר אנשיו ישבו בקומה השלישית, שתי קומות מעלינו, תיכף תבינו למה הפרט הזה חשוב.
כדי לשמור על תאימות בין המידע שנגזר למערכת החדשה לבין המידע המרכזי, היו מריצים מהלכים יומיים של השוואה בין נתוני המערכות, ובכל פעם שהיה הבדל, היינו שומעים עד הקומה שלנו את הצעקות "אמינות נתונים, אמינות נתונים".
כמו בכל הטמעה של מערכת חדשה, לא תמיד המשתמשים מרוצים, והם מחפשים תירוצים למה לא לקבל את המערכת. אמינות הנתונים היתה בעיה אמיתית ולא תירוץ, והיה צורך אמיתי לטפל בבעיה, כדי להטמיע את המערכת החדשה, שבסופו של דבר אמורה לשפר את תהליכי העבודה.

מידע שאפשר לסמוך עליו

בתקופה האחרונה עלו לכותרות שני מקרי התרסקות מטוס בואינג 737MAX. לאחר ההתרסקות השניה, קורקעו כל המטוסים מהסוג הזה, ובואינג הפיצה תיקון לאחד מרכיבי התוכנה שקשורים בבקרת הטיסה. הסבר על קצה המזלג למי שלא מכיר – בכל מטוס יש אלפי חיישנים שמודדים פרמטרים שונים שקשורים להטסה של המטוס, הן ע"י טייס אנושי והן על-ידי טייס אוטומטי. אחד החיישנים הוא חיישן זווית התקפה שמטרתו זיהוי הזדקרות (אני לא רוצה להסתבך יותר מדי בהסברים אז להרחבה ניתן לקרוא בויקיפדיה). הבעיה היתה שבדגם הזה של המטוס אמנם הותקנו שני חיישנים, אבל רק אחד נלקח בחישובים של האלגוריתם, וכאשר היתה בעיה במידע – האלגוריתם פעל לפי המידע השגוי.

ככלל, רוב המערכות בכלי טיס מתוכננות עם גיבוי אחד לפחות, בדיוק למקרים שתהיה תקלה, וכידוע באוויר קשה לעצור בצד ולהרים מכסה מנוע.

התיקון שבוצע הוא התייחסות שלני החיישנים, ומתן התראה לטייס, על בעיה, תוך ניתוק חלק מהמערכות האוטומטיות והעברת השליטה על המטוס מהטייס האוטומטי לטייס האנושי. כפי שציינתי – זה הסבר מופשט. לקריאה נוספת – ממליץ לחפש מידע על מערכת MCAS.

מידע מוזר ובדיקות שפיות

זהו, הגענו גם לבחירות 2019.

יאמר לזכות ועדת הבחירות המרכזית שהם הקימו אתר שמציג בשקיפות ובנוחות רבה את המידע המצטבר על תוצאות ספירת הקלפיות. בזכות שקיפות זו גילו הגולשים שבהתחלה נתוני הבסיס של בעלי זכות הבחירה היו מהבחירות הקודמות (תוקן די מהר), ובזכות שקיפות זו העלו גולשים רבים, ואני בתוכם, צילומי מסך של קלפיות בעייתיות.

מהי קלפי בעייתית?

קלפי שבה יש אחוז גבוה מאוד של מצביעים למפלגה שלא הולמת את צביון האיזור בו ממוקמת הקלפי, למשל – הצבעה מאסיבית למפלגת העבודה באיזור חרדי מובהק, או הצבעה לפלגה ימנית קיצונית בישוב לא יהודי. אפשרות נוספת היא קולות רבים למפלגה קטנה, רחוקה מאוד מאחוז החסימה, כאשר באותה קלפי, מפלגה גדולה לא קיבלה אפילו קול אחד. בתחילת התהליך היו קלפיות רבות כאלה, ועם התקדמות תהליכי הדיווח והבקרה של המפלגות ושל ועדת הבחירות המרכזית – התופעה הצטמצמה מאוד.

גם לאחר פרסום התוצאות הרשמיות, עדיין יש לפחות קלפי אחת שהנתונים בה לא מסתדרים לי, למרות שהמידע דווח במספר ערוצים, זהו המידע שתקף.

 

חשיבותה של אמינות הנתונים

כשיש נתון או מידע שלא ניתן לאמת אותו בשום דרך, או לתקוף את ההגיון שבו – מעטים האנשים שינסו לטעון אחרת. רק המפוזר מכפר אז"ר (לאה גולדברג) אומר "זה שבחלון זורח שמו הוא שמש או ירח", או חובבי קונספירציה שוטענים כי הארץ שטוחה. לעומת זאת, כאשר ניתן לסתור את המידע, או לתקוף את מהימנותו בצורה לוגית או מדעית, תמיד יימצא מי שיעשה זאת.

קשה יהיה להשתמש במידע שהצלחנו לערער את אמינותו, וכאשר המידע הזה נועד לשכנע אנשים לעשות משהו, או נועד לשנות תהליך, או ממשלה – לפחות חלק מהציבור יתקשה לקבל את ההחלטה, במיוחד כשזו לא הולמת את רצונו, אמונתו או שאיפותיו. ולראיה – כמות הפניות של גורמים שונים לועדת הבחירות, ושינויי התוצאות שהיו בעקבות בדיקות אלה – מחזקות את הצורך במידע אמין, כל עוד יש לפחות פרט מידע אחד שאמינותו מוטלת בספק.

לדעתי, אמינות הנתונים, היא קריטית בהליכים כאלה, וכמובן במקרה השני שהוזכר – התקלה ב-737 מקס.

כאחד שעוסק כבר שלשה עשורים במידע, אני נותן משקל רב לתהליכי הבקרה על המידע, איתור בעיות וטיוב מידע בכל מקום שיש בו פער, וזו בעצם הסיבה לפוסט הזה.

מחשבות לבחירות הבאות

בדומה לצעד הגדול של שקיפות המידע, צריך להתכונן ולבצע צעד נוסף – לסרוק ולהציג את הטפסים המקוריים של ספירת הקולות, או לחליפין, אם נעבור לספירה ממוחשבת או הצבעה ממוחשבת – להציג את נתוני המקור. אני מקווה שבדיקות הנתונים שאני עשיתי בשבוע האחרון, נעשו גם בידי אנשי ועדת הבחירות המרכזית. אם לא – חשוב לבצע אותן מוקדם ככל האפשר, ולהגיע למצב בו הנתונים אמינים מעל כל ספק סביר.

ביצוע דו"חות הצלבה בין תוצאות קלפי לתוצאות איזוריות יאפשר לזהות מבעוד מועד חריגות אפשריות וטעויות של ספירה או הזנה.

חשוב לצמצם ככל האפשר את אפשרות הטעות של הגורם האנושי, לא בגלל שאנחנו "מקולקלים", אלא כי לטעות זה באמת אנושי!

ככל שהנתונים יהיו אמינים יותר, הציבור יקבל בקלות גדולה יותר את התוצאות, גם כשהן אינן לרוחו, והדבר נכון גם אם בעתיד הקרוב או הרחוק נעבור להצבעה דיגיטלית.

תגובתך בבקשה...

מחשבה אחת על “בחירות 2019, בואינג 737 מקס ואמינות נתונים”