נתונים.נתונים. נתונים. ב-1954 יצא לאור ספרון בן 142 עמודים לא גדולים, עם הרבה ציורים, שהפך לרב מכר עולמי. למעשה, זהו ספר הסטטיסטיקה הנמכר ביותר בכל הזמנים. כותרתו: “How to lie with Statistics”. ואכן מאז (וכנראה עוד הרבה לפני) זוכים הסטיסטיקאים לתדמית שלילית למדי.

יחד עם זאת לנתונים – איסוף, ארגון, ניתוח ותצוגה שלהם – חלק מהותי וקריטי בעיצוב מדיניות. שכן החלופה לאי-שימוש בנתונים יבשים היא עבודה לפי תחושת בטן. לא יודעת מה עם הבטן שלכם, אני בכל אופן פחות מעדיפה להמר על תחושות ואנקדוטות.
מהפכת הנתונים
המהפכה הדיגיטלית שבה אנו חיים מאפשרת לנו לייצר ולאגור כמויות עצומות של נתונים. בעשור האחרון התפתח המושג של ביג-דאטה – Data Big – או נְתּונֵי עָתֵק בעברית תקנית. במקור המושג ביג-דאטה מתייחס בעיקרו למאגרי נתונים עצומים כל כך עד ששיטות מסורתיות לעיבוד נתונים אינן מתאימות עוד. אולם לאחרונה רבים נוטים להשתמש במושג ביג-דאטה כשם כולל לעבודה עם דאטה ולכל שימוש בטכניקות מתקדמות לעיבוד וניתוח נתונים ללא קשר לגודל הנתונים.
שלוש מגמות אפשרו את הגידול העצום בכמות הנתונים:
- תחילה היו אלה מערכות המידע השייכות לארגונים (כגון בנקים וחברות תקשורת) שאפשרו איסוף נתונים מתמשך.
- בהמשך, עם הופעת האינטרנט והרשתות החברתיות, התעצמה מגמה זו כאשר המשתמשים החלו תרום נתונים בעצמם. כמות הנתונים שכלל האנושות מייצרת כתוצאה משימוש באינטרנט וברשתות החברתית מגיעה למספרים עצומים. בכל דקה שחולפת נשלחות למעלה מ-16 מיליון הודעות WhatsApp ומבוצעים למעלה מ-5.3 מיליון חיפושים חדשים בגוגל.
- נוסף למידע שאנו מוסרים באופן אקטיבי ע"י שימוש ברשתות/אתרים, ישנן הערכות שמדברות על כך שעד שנת 2025 יהיו מילארד מכשירים חכמים מחוברים לרשת שידווחו עוד ועוד פרטים עלינו (טלפון חכם, מד דופק, נעלי ספורט סופרות צעדים ועוד). מדובר בנתונים שנוצרים אוטומטית על ידי המכונה וללא התערבות ישירה של המשתמשים האנושיים.
מעגל עבודה עם דאטה
חשיבות הדאטה (data) – ממשיך לעלות גם בתעשייה, אחת המשרות הנדרשות ביותר היא חוקר נתונים, וכך גם המגזר הציבורי מתחיל להבין כי הוא יושב על מכרה זהב ויש לשייף, לדייק ולמלא את מאגרי המידע שלו כדי ללמוד מהם תובנות ולקחים למדיניות טובה יותר.
אנליסט נתונים (Data Analyst) בעצם מתרגם מידע לידע. עבודה עם דאטה פירושה ללמוד מה קורה עכשיו על מנת לזהות מגמות ולבצע תחזיות לגבי העתיד. בכל ארגון ובכל תחום, תפקידו של אנליסט לנתח את הנתונים ולהשתמש בתוצאות התחקור כמנוע אסטרטגי לקבלת החלטות טובות יותר המבוססות נתונים. בחברות עסקיות – מדובר בשיפור ביצועים של הפרימה; במגזר הציבורי – שיפור קבלת ההחלטות והתווית מדיניות. וכך מעצם מעגל עבודה עם דאטה מזין את עצמו:

איסוף ויצירת נתונים
השלב הראשון בתהליך בניית מאגר הדאטה הוא יצירת נתונים בסיסיים; בדגש על הרמוניזציה של מדדים המאפשרים להשוואה בין תפוחים לתפוחים . נתונים יכולים להיות (וצריכים להיות) גם כמותיים ואיכותניים.
כמו שגיא המחבר של הבלוג המעולה "הרגולטור" כותב, האתגר הגדול הוא לא להשתמש בנתונים בשלב קבלת ההחלטות, אלא לעבוד בשגרה כדי שהנתונים יהיו קיימים כשנצטרך אותם. לעיתים קרובות, המידע והנתונים בכלל לא נאספים. נתונים הכרחיים לקבלת החלטות, אבל בדרך כלל אנחנו נזכרים בזה ברגע שבו אנחנו צריכים אותם.
מיון, שמירה ועיבוד
עבודה עם דאטה מצריכה משנה זהירות. כשאנחנו מדברים על מאגרי עתק, על מידע פרטי שמדווח ע"י אנשים ובעיקר על נתונים מנהליים שהרשויות אסופות עלינו – יש חשיבות מכרעת למשטר הגנה על פרטיות ומניעת זליגת נתונים רגישים/אישיים למקורות חיצוניים.
בשלב זה מאגרי המידע עוברים ניקיון והרמוניזציה. נקודה חשובה נוספת היא בדיקה של מידע חסר. אם עושים ניתוח של תובנות מטוויטר. מה לגבי המבוגרים? החרדים? ילדים? אנשים מרקע סוציאו-אקונוי נמוך? יש פה סלקציה פנימית והטייה של המידע, ולכן חשוב לייצר מנגנונים לשערוכים איכותיים כדי להשלים את התמונה.
ניתוח, שיתוף והזנה
זהו השלב הקריטי שבו קורה הקסם. הקופסא השחורה שמערבבת את כלל הנתונים ופתאום נותנת לנו תובנות מורכבות ומעניינות כדי לשפר את מהלך קבלת ההחלטות.
אז זהו, שלא. השלב הזה הוא באמת חשוב אבל רחוק מאוד מלהיות קסום. מדובר יש פה שימוש במאגרי מידע קיימים, בנתונים שנאספו ובעיקר חידוד השאלות הנכונות שאפשר לגזור. שקיפות מתחילה בתוך הבית – למשל כאשר משרד ממשלתי אחד יכול לקבל ולהשתמש במידע שמשרד אחר אסף. מדובר באתגר משמעותי, גם בגלל הפוליטיקה הארגונית וגם בגלל הצורך לאמץ סטנדרטים ושיטות עבודה אחידות שיאפשרו לכולם בממשלה להשתמש בנתונים. אין דבר יותר טיפשי מאיסוף נתון שכבר נמצא בידי הממשלה.

בהחלטת ממשלה 1933 (שיפור העברת המידע הממשלתי והנגשת מאגרי מידע ממשלתיים לציבור) משנת 2016 נקבע שמשרדי הממשלה ישתפו ביניהם מידע (כאשר מדובר בנתון ששניהם דורשים מהציבור) ושמשרד ממשלתי לא יבקש מהציבור מידע על שקיים בידי משרד ממשלתי אחר (החל מ-2022 יחול על אנשים פרטיים והחל מ-2023 יחול על תאגידים). עקרון זה ראינו במערכת הX-Road של אסטוניה.
והנה בבקשה, עוד החלטה שמבקשת לבנות על עקרון שיתוף הפעולה של מידע, בשנת 2019 עוד החלטת ממשלה 4753 (הגברת השימוש במידע ממשלתי לצורך שיפור המדיניות הממשלתית והגברת האפקטיביות של פעולות הממשלה).הממשלה מתחילה להטמיע את עקרון עבודה עם דאטה כדי לשפר את קבלת ההחלטות שלנו.
ניתוח, שיתוף והזנה
במעבר בין השלב השלישי לרביעי נמצא רוב מה שאנחנחנו מכירים שעבודה עם דאטה. ניתוחים, מסקנות סטטיסטיות, הגדרת צורך בנתונים נוספים, סקרים ייחודיים (דוגמת סקר הכישורים של ארגון ה-OECD). זה השלב של הנגשת נתונים ע"י אינפוגרפיקות, יצירת דשבורד של ניתוח מצב, בניית תכנית עבודה ותחילתו של המעגל מחדש לאיסוף ומיון נתונים מחדש.
עבודה עם דאטה למקבלי החלטות במגזר הציבורי
או קיי, יש לנו את מעגל הנתונים? איך ולמה כל זה רלוונטי למדיניות ציבורית וכיצד אפשר ליישם תובנות מעבודה עם דאטה לטובת המערכת הציבורית?
דאטה איכותי הוא כלי חשוב לשיפור מדיניות הממשלה. ככל שהנתונים הופכים לתשתיות שכיחה ושימושיות יותר ויותר למדינות, כך הנתונים הופכים להיות שלב אקוטי בתכנון מדיניות. על מנת להנגיש את השימוש בנתוני בסיס לקובעי מדיניות, ה- Open Data Institute פיתח סדרה של דפוסי תכנון כדי לסייע למקבלי החלטות בזירה הציבורית להבין את חשיבות השימוש בנתונים ליצירת השפעה.
דפוסי תכנון:
- שיפור חווית המשתמש – התערבויות אלה יוצרות חיים טובים יותר עבור האזרחים, בעיקר (אך לא רק) ביחסי הגומלין שלהם עם שירותים ציבוריים. דוגמא אחת היא מתן נתוני מיפוי פתוחים לכולם. ניתן להשתמש בנתונים אלו לדברים פשוטים כמו מציאת תחנת אוטובוס, וכלה בסיוע במאמצים לתכנון עירוני- קהילתי לעמידות בשיטפון (ראה מקרה אסון המעלית וההצפות שתופסות אותנו לא מוכנים כל חורף מחדש).
- ניצול יעיל יותר של משאבים – פיקוח על ביצוע של רגולציה יכול לגזול משאבי זמן יקרים, ולאו דווקא תמיד משרת בצורה המיטבית את מטרת המדיניות. תהליך הפיקוח טומן בחובו איסוף של נתונים על מושא הרגולציה,ומה אם נעבור במקום זה למידע שנאסף ע"י דיווח והצהרה עצמית? או זיהוי מגמות ונק' השפעה שמצריכות פיקוח מיוחד? ניתוח נתוני מאקרו איפשרה לעיריית ניו יורק בארה"ב לצמצם את מספר הביקורות של שירותי הכבאות ולגרום להם להיות יעילות יותר.
- הנגשת שירות – התערבויות דאטה אלה הופכות את מתן השירות או את מילוי דרישות הרגולציה ליעילות יותר על ידי המגזר הציבורי. דוגמאות אופייניות כוללות סטנדרטיזציה והשוואה (benchmark) של מתן שירות לציבור כגון בתי ספר לזיהוי חולשות והנעה לפעולה. האתר מיצ"ב ברשת מאפשר קריאה נוחה של נתונים בהצגה גרפית והשוואה בין בתי ספר באזור לפי חיתוכים שונים.

- חינוך השוק – התערבויות אלה מתמקדות בהנגשת נתונים על מנת לתקן כשלי שוק, כגון פירוק מונופולים, טיפול בהשפעות חיצוניות וקידום תחרות. דוגמאות אופייניות כוללות פרסום נתוני פער שכר, שימוש בשקיות ניילון ומערכות נתונים אחרות כדי לגרום לשינויים בהתנהגות.
- ניהול טוב יותר של נתונים – עצם חובת פרסום הנתונים מסייע לרשות הממשלתית לנהל בצורה יעילה ומועילה יותר את הנתונים שהיא מסתמכת עליהם, ועם יתרונות חברתיים וכלכליים רחבים יותר. הסקרם הנרחבים של הלמ"ס מאפשרים למדינה (גם ברמת משרדי ממשלה וגם ברמת הרשות המקומית) להבין קצת יותר את איפיון האוכלוסיה שלה, אילו צרכים ומכאובים יש לתושבים ולייצר פתרונות בהתאם. כך למשל עצם פרסום ספר תוכניות העבודה עם יעדים מדידים של משרדים, או ביצוע של החלטות ממשלה – מאפשר שקיפות ומשפר את איסופן ודרך קבלת החלטות.
ולסיכום?
מהפכת הנתונים כבר. עבודה עם דאטה זה לא מותרות, זו צריכה להיות דרישת סף של מגזר ציבורי שרוצה להיות רלוונטי לאזרחים ולשפר את חווית התושבים שלו. המידע קיים. בהמוניו… יש יותר מדי ממנו. השאלה מה עושים עם חומר הגלם של הררי המידע שנאסף לגבינו בממשלה וברשויות.
עצה אחת שלמדתי לאורך הדרך – זה לשמור את זה פשוט ונגיש. ערך הנתונים עולה ככל שהוא הופך לסיפור. יחדיו הסיבה שיש להשתמש במיומנויות מדעי נתונים וסטוריטלינג יחדיו. מי שעובד עם הנתונים חייב להיות מסוגל לתקשר מדוע זה חשוב או שימושי, אחרת הערך הולך לאיבוד.