ד"ש מונקובר

Hi from Vancouver
תאריך

דניאל עומר, מאסטרנט של ד"ר אור שפט, טס לכנס NeurIPS, בתחום הבינה המלאכותית והתאוריה של מדעי המחשב שנערך השנה בוונקובר. במהלכו הוא הציג מאמר שעוסק בחיבור בין פרטיות דיפרנציאלית ובדיקת השערות

בחודש דצמבר 2024 טס דניאל עומר לוונקובר שבקנדה, לכנס NeurIPS (Neural Information Processing Systems), אחד הכנסים הגדולים ביותר בתחום הבינה המלאכותית והתאוריה של מדעי המחשב. במהלך הכנס הציג דניאל כפוסטר את המאמר שלו ושל המנחה שלו, ד"ר אור שפט, שעוסק בחיבור בין שני עולמות: פרטיות דיפרנציאלית ובדיקת השערות. "פרטיות דיפרנציאלית היא דרך מתמטית 'להבטיח' שאפילו אם אני חלק ממאגר נתונים כלשהו – אי אפשר יהיה לדעת זאת בוודאות (או כמעט בוודאות), גם אם יפעילו על המידע 'קסמים' סטטיסטיים. הדרך לעשות זאת היא על ידי הוספה לתוצאה של האלגוריתם, כלומר לפניה לקבלת מידע ממאגר הנתונים, 'רעש' מדוד, שיסתיר את הזהות שלי אבל עדיין יספק תשובה שימושית, תוך פגיעה קטנה בדיוק. במילים אחרות, המידע שמתקבל מהמאגר לא ישתנה באופן משמעותי אם אחליט להצטרף או לעזוב אותו. זו הדרך של המתמטיקה לומר 'הנתונים שלך בטוחים, כי גם אם יש טביעת אצבע, היא מטושטשת כמעט לחלוטין'", הוא מסביר. "בדיקת השערות היא אחת מאבני היסוד של הסטטיסטיקה, כאשר המטרה היא להכריע האם דפוס מסוים בנתונים נובע מאקראיות או משקף תופעה אמיתית. אך בעולם שבו פרטיות דיפרנציאלית נכנסת לתמונה, אנחנו נדרשים לחשוב מחדש על כלים סטטיסטיים מסורתיים".

לדברי דניאל, בעוד ששיטות סטטיסטיות קלאסיות מתבססות לעיתים קרובות על הנחות אסימפטוטיות – כלומר, ניתוחים שמתקרבים לדיוק ככל שמספר הדגימות גדל לאינסוף – פרטיות דיפרנציאלית מגבילה אותנו: עלינו לדעת בדיוק כמה דגימות יש לנו וכמה שונות הן יכולות להיות אחת מהשנייה. "רוב העבודות בתחום עסקו בשאלות על דומיין ((Domain בדיד, כלומר התפלגויות בעלות אוסף של ערכים ספציפיים שהתפלגות יכולה 'לבחור' מתוכם. אנחנו הראשונים שלקחנו את השאלה צעד אחד קדימה כאשר הדומיין הוא רציף, כלומר למשל טווח של ערכים שכל מספר בתוכו אפשרי, כולל שברים אינסופיים, תוך מינימום הנחות על ההתפלגות. הפתרון דרש רעיונות יצירתיים וניתוח מדויק, שהצליחו לאזן בין דרישות הפרטיות לבין היכולת להפיק תובנות סטטיסטיות משמעותיות", הוא מספר.

דניאל, בן 26 מאור יהודה, סיים את התואר הראשון שלו במתמטיקה עוד בתיכון. בימים אלו הוא מסיים את התואר השני שלו במתמטיקה, כשהמנחה שלו הוא ד"ר אור שפט מהתוכנית להנדסת מחשבים. "כשחיפשתי מנחה לתזה, היה לי ברור שאני רוצה לעשות אותה בתחום שקשור לפרטיות, ובאותו הזמן הכרתי בעיקר את התחומים שקשורים לקריפטוגרפיה. ואז שמעתי על קורס בהנדסה בתחום שנקרא 'פרטיות דיפרנציאלית', נרשמתי אליו - וכך הכרתי לראשונה את אור ואת העולם המרתק של פרטיות דיפרנציאלית, והבנתי שאני רוצה להעמיק בזה יותר. אור הוא האיש שפתח בפניי את הדלת. השאלות והמחקר שאנחנו שואלים הם בעיקר תאורטיות, ובעבודה תיאורטית, במיוחד בהתחלה, ללא הכוונה נכונה אפשר מאוד בקלות ללכת לאיבוד. לאור חשוב מאוד שניפגש מדי שבוע, אפילו אם לא הייתה התקדמות משמעותית במחקר, ובמהלך הפגישות אנחנו מחדדים רעיונות ומעלים שאלות חדשות. זה עוזר לי מאוד. הרבה פעמים ההתקדמות האמיתית במחקר מתרחשת במהלך הפגישות עצמן".

במהלך הכנס הציג דניאל את המאמר שכתב במשותף עם ד"ר שפט: "Differentially Private Equivalence Testing for Continuous Distributions and Applications". "ההצגה עצמה נמשכה כשלוש שעות רצופות, אבל היא עברה לי מהר, והיה לי כיף לראות אנשים ניגשים, מתעניינים ושואלים שאלות טובות, במיוחד שחלק מהם היו אנשים שקראתי את המאמרים שלהם, ולראשונה ראיתי את האנשים מאחורי השמות. זה היה רגע שבו העולם האקדמי קיבל פתאום ממד אנושי ומוחשי".

תאריך עדכון אחרון : 30/01/2025