בית שמע מהי איתור מוקדם יותר? - הגדרה מטכנולוגיה

מהי איתור מוקדם יותר? - הגדרה מטכנולוגיה

תוכן עניינים:

Anonim

הגדרה - מה המשמעות של גילוי מוקדם יותר?

איתור מוקדם יותר הוא תהליך גילוי ומחיקת מחיקים ממערכת נתונים נתונה.

ניתן להגדיר חלון מקיף כנתון או תצפית החורג באופן דרסטי מהנורמה או מהממוצע של מערך הנתונים. חלון מתח יכול להיגרם פשוט במקרה, אך הוא עשוי גם להצביע על שגיאת מדידה או שלמערכת הנתונים הנתונה יש התפלגות זנב כבד.

להלן תרחיש פשוט בגילוי מוקדם יותר, תהליך מדידה מייצר בעקביות קריאות בין 1 ל 10, אך במקרים נדירים אנו מקבלים מדידות של יותר מ 20.

המדידות הנדירות הללו מעבר לנורמה נקראות מחיצות מכיוון שהן "שוכבות מחוץ" לעיקול החלוקה הרגיל.

Techopedia מסביר גילוי מוקדם יותר

אין באמת שיטה מתמטית סטנדרטית ונוקשה לקביעת מכפיל מתח מכיוון שהיא באמת משתנה בהתאם לאוכלוסיית הסט או לנתונים, כך שקביעתה וגילויו בסופו של דבר הופכים להיות סובייקטיביים. באמצעות דגימה רציפה בשדה נתונים נתון, ניתן לקבוע מאפיינים של חלון מתח כדי להקל על הגילוי.

ישנן שיטות מבוססות מודל לגילוי מחיצות והן מניחות שהנתונים כולם נלקחים מההפצה הרגילה ויזהו תצפיות או נקודות, הנחשבות כלא סבירות על סמך סטיית תקן או סטנדרט, כמתארים. ישנן מספר שיטות לגילוי מוקדם יותר:

  • מבחן גרב למוצאים חוץ - זה מבוסס על ההנחה שהנתונים נמצאים בתפוצה נורמלית ומסלק מחליף אחד בכל פעם, כאשר המבחן חוזר על עצמו עד שלא ניתן למצוא עוד מחיצות.
  • מבחן ה- Q של דיקסון - מבוסס גם על נורמליות מערך הנתונים, שיטה זו בודקת נתונים רעים. צוין כי יש להשתמש בזה במשורה ולעולם לא פעם בפעם בערכת נתונים.
  • הקריטריון של שובנאט - זה משמש לניתוח אם המתווך מזויף או שהוא עדיין בגבולות ונחשב כחלק מהתפאורה. נלקחים הממוצע וסטיית התקן ומחושבת ההסתברות שהמתרחש מתרחש. התוצאות יקבעו אם יש לכלול אותו או לא.
  • הקריטריון של פירס - נקבע מגבלת שגיאה לסדרת תצפיות שמעבר להן יושלכו כל התצפיות מכיוון שהן כבר כרוכות בטעות כה גדולה.
מהי איתור מוקדם יותר? - הגדרה מטכנולוגיה