Using Formal Verification tools for Reinforcement Learning
שימוש בכלי אימות פורמלי עבור למידה מבוססת חיזוקים
מספר פרויקט
602
סטטוס - הצעה
הצעה
אחראי אקדמי
מגמת לימוד
שנה
2024
מסלול
מסלול משני
הרקע לפרויקט:
מודלים של למידה מבוססת חיזוקים נוטים להיות לא יציבים ולעיתים לא מצליחים להתכנס. בעזרת שימוש בכלים של אימות פורמלי ניתן לקבל מידע שיעזור לסוכן ללמוד ולהגיע להתכנסות יציבה.
מטרת הפרויקט:
להצליח להראות תרומה של כלי אימות פורמלי עבור בעיות גדולות של למידה מבוססת חיזוקים, בדגש על סוכן סטוכסטי.
תכולת הפרויקט:
מימוש חיבור של כלי אימות הסתברותי לבעיות RL בסקייל גדול, מתוך מטרה לייצב את הלמידה ולאפשר לה להתכנס.
קורסי קדם:
למידה מבוססת חיזוקים, אימות פורמלי וסיתנזה
דרישות נוספות:
יכולת תכנות גבוהה
מקורות:
https://drive.google.com/file/d/1WAOVDmMDfXpxZ0X0IXu6LAzFKJSVMLrQ/view
תאריך עדכון אחרון : 31/07/2023