Formal verification for Deep Reinforcement Learning

שימוש בכלי אימות פורמלי עבור למידה מבוססת חיזוקים המשלבת למידה עמוקה

מספר פרויקט
603
סטטוס - הצעה
הצעה
אחראי אקדמי
שנה
2024

הרקע לפרויקט:

מודלים של למידה מבוססת חיזוקים משלבים בתוכם רשתות נוירונים עמוקות. נרצה להשתמש בכלי אימות פורמלי על מנת לקבל מידע שיעזור לסוכן ללמוד ולהגיע להתכנסות יציבה.

מטרת הפרויקט:

להצליח להראות תרומה של כלי אימות פורמלי עבור בעיות RL המשלבות רשתות נוירונים עמוקות.

תכולת הפרויקט:

בנייה ותכנון של בעיות המשתמשות ב-DRL, שניתן להשתמש עבורן בכלי אימות פורמלי על מנת לייצב את הלמידה ולאפשר לה להתכנס.

קורסי קדם:

למידה מבוססת חיזוקים, אימות פורמלי וסינטזה

דרישות נוספות:

יכולת תכנות גבוהה

מקורות:

https://drive.google.com/file/d/1WAOVDmMDfXpxZ0X0IXu6LAzFKJSVMLrQ/view

תאריך עדכון אחרון : 31/07/2023