תוכן עניינים:
הגדרה - מה המשמעות של Deep Q-Networks?
רשתות Deep Q (DQN) הן רשתות עצביות (ו / או כלים קשורים) המשתמשות בלמידה מעמיקה של Q על מנת לספק מודלים כמו הדמיה של משחק אינטליגנטי במשחקי וידאו. במקום להיות שם ספציפי לבניית רשת עצבית ספציפית, Deep Q Networks עשוי להיות מורכב מרשתות עצביות מפותלות ומבנים אחרים המשתמשים בשיטות ספציפיות כדי ללמוד על תהליכים שונים.
Techopedia מסביר Deep Q-Networks
השיטה של למידת Q מעמיקה בדרך כלל משתמשת במשהו שנקרא איטרציה של מדיניות כללית, המתוארת כשילוב של הערכת מדיניות ואיתור מדיניות, כדי ללמוד מדיניות מתוך קלט חושי ממדי גבוה.
לדוגמה, סוג נפוץ של רשת Q עמוקה המכוסה בפרסומי טק כמו Medium לוקח קלט חושי ממשחקי וידיאו של Atari 2600 למודל של תוצאות. זה נעשה ברמה בסיסית מאוד על ידי איסוף דגימות, אחסנתם ושימוש בהם לשידור חוזר לחוויה על מנת לעדכן את רשת ה- Q.
במובן כללי, רשתות Q עמוקות מתאמנות על תשומות המייצגות שחקנים פעילים באזורים או מדגמים מנוסים אחרים ולומדים להתאים את הנתונים הללו לתפוקות הרצויות. זוהי שיטה עוצמתית בפיתוח בינה מלאכותית שיכולה לשחק משחקים כמו שחמט ברמה גבוהה, או לבצע פעילויות קוגניטיביות ברמה גבוהה אחרת - הדוגמא של משחקי הווידיאו Atari או משחק השחמט היא גם דוגמא טובה לאופן בו AI משתמשת ב- סוגים של ממשקים ששימשו באופן מסורתי על ידי סוכנים אנושיים.
במילים אחרות, עם למידה מעמיקה של Q, נגן ה- AI צריך להיות יותר כמו שחקן אנושי בלימוד להשגת תוצאות רצויות.