Differentially Private Statistical-Hypothesis Tessting

מבחנים סטטיסטיים המשמרים פרטיות

מספר פרויקט
802
סטטוס - הצעה
הצעה
אחראי אקדמי
שנה
2024
מסלול משני

הרקע לפרויקט:

שיטות לניתוחי דאטה המשמרות פרטיות באות במגוון דרכים ואלגוריתמים, ולכל אחת מהן יש טרייד-אוף משלה בין יעילות הניתוח לבין כמות "הפסד הפרטיות".

בפרויקט זה יתנסו הסטודנטים במימוש, בניתוח ובהשואה בין השיטות השונות.

מטרת הפרויקט:

מבחנים סטטיסטיים הוא תחום רחב של ניתוח דאטה באמצעותו סטטיסטיקאים משיגים תובנות עומק על דאטה. ישנן מטרות רבות אותן מבקש הסטטיסטיקאי לנתח (זהות, אי-תלות, רגרסיה וכו') ולכל אחת מגוון מבחנים שונים (פירסון, Z-test, הילברט-שמידט) שמתאימים כל אחד למצב מעט שונה.

בפרויקט זה יתרכזו הסטונדטים בביצוע מבחנים סטטיטיים ע"י אלגוריתמים משמרי פרטיות. בפרט, הפרויקט יתמקד בשיטות בפרטיות דיפרנציאלית -- שפועלות על ידי הרעשה רנדומית של המבחן הסטטיסטי. ומאחר שמבחנים סטטיסטיים הוא תחום רחב - הרי שפרויקט זה הוא למעשה אוסף פרויקטים דומים-אך-שונים, כשכל פרויקט מתמקד בשיטת מבחן אחרת.

חלק לא מבוטל בפרויקט הוא הכרת התחום של פרטיות דפרנציאלית, קריאת מאמרים והבנת השיטות השונות. משהסטודנטים ירכשו את הידע המוקדם, עיקר הפרויקט יתמקד בתכנון אלגוריתמי של ניתוחים סטטיסטיים שונים, במימוש שיטות, ובהשואת האלגורתימים על גבי מגוון דאטה-סטים שונים.

תכולת הפרויקט:

  • קריאה של מאמרי רקע
  • בחירת ה setting בו יתמקד הפרויקט
  • מימוש אלג' למידה פרטית
  • השואה של האלגוריתמים השונים על גבי דאטה-סטים שונים
  • ניתוח תאורטי של האלג'


קורסי קדם:

  • הסתברות וסטטיסטיקה
  • למידה ממוחשבת
  • אלג' 2 (ניתוח אלג' רנדומיים)


דרישות נוספות:

  • פרטיות דפרנציאלית (מומלץ)


מקורות:

  1. https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf
  2. https://ccanonne.github.io/files/misc/main-survey-fnt.pdf (Ch. 4)

תאריך עדכון אחרון : 31/07/2023