Using Formal Verification tools for Reinforcement Learning

שימוש בכלי אימות פורמלי עבור למידה מבוססת חיזוקים

מספר פרויקט
602
סטטוס - הצעה
הצעה
אחראי אקדמי
שנה
2024

הרקע לפרויקט:

מודלים של למידה מבוססת חיזוקים נוטים להיות לא יציבים ולעיתים לא מצליחים להתכנס. בעזרת שימוש בכלים של אימות פורמלי ניתן לקבל מידע שיעזור לסוכן ללמוד ולהגיע להתכנסות יציבה.

מטרת הפרויקט:

להצליח להראות תרומה של כלי אימות פורמלי עבור בעיות גדולות של למידה מבוססת חיזוקים, בדגש על סוכן סטוכסטי.

תכולת הפרויקט:

מימוש חיבור של כלי אימות הסתברותי לבעיות RL בסקייל גדול, מתוך מטרה לייצב את הלמידה ולאפשר לה להתכנס.

קורסי קדם:

למידה מבוססת חיזוקים, אימות פורמלי וסיתנזה

דרישות נוספות:

יכולת תכנות גבוהה

מקורות:

https://drive.google.com/file/d/1WAOVDmMDfXpxZ0X0IXu6LAzFKJSVMLrQ/view

תאריך עדכון אחרון : 31/07/2023