תוכן עניינים:
גנומיקה קלינית היא נושא מרתק, בו אנשים עובדים על טכנולוגיות מתקדמות כדי לעבד תוצאות מהירות ומדויקות. ישנם המון רצפי גנום שקיימים בשוק והם מייצרים פטביטים של נתוני רצף, והצמיחה ברצף הולכת לייצר צמיחת נתונים בזמן הקרוב. כאן, Hadoop היא הפלטפורמה המושלמת לעיבוד זרימת עבודה מורכבת של גנומיקה. Hadoop יכולה לאחסן ולמיין כמויות אדירות של מידע ויכולה גם לבצע ניתוח משמעותי. (כדי לקבל מושג על כמה נתונים זה באמת קשור, קרא את הבנת הביטים, הביטים והמכפילים שלהם.)
ההווה והעתיד של הגנום
כיום, מיפוי הגנום הגיע לשיא ההתפתחות שלו. אנשים רבים הקשורים לתעשיית הגנום מתפוצצים מסקרנות, וככל שהזדמנויות חדשות מציגות את עצמן, טכנולוגיה טובה יותר היא הצורך של השעה. רצף גנום הוא משימה חזקה מאוד ועתירת משאבים. בשנת 2013 בלבד הופקו כ -15 פטאטים של נתונים, ורק על ידי 2, 000 רצפים. כמות נשירת לסת זו כללה 300 קילוגרם של נתונים בגנום אנושי ברצף. בקצב זה של ייצור נתונים, ניתן להעריך כי עד שנת 2018 יפיקו כמות אחת של נתונים בודדים. זה נובע מגידול רצפי רצף, שייצרו יותר ויותר נתונים בכל ריצה. סיבה נוספת היא הופעתן של מכונות רצף גנום חזקות במיוחד בעלות נמוכה. מאז 2008 מחיר מכונות אלה יורד בהתמדה. הסיבה לכך היא מכונות הדור הבא העוצמתיות שנכנסה לשוק.
צרכי ענף מיפוי הגנום
אלגוריתמים מורכבים משמשים לעיבוד הנתונים שנאספים מהגנום האנושי. לאחר מכן, מידע זה צריך להיות מאוחסן. יתכן שהוא ייבחן בעתיד לצורך השוואה לנתונים המקוריים. המשימה לעיבוד ואחסון של 100 GB של נתונים אינה קשה מדי, במיוחד כשאתה עושה את זה עם המכונות החזקות המופעלות במרכזי הרצף. מחקרים מראים כי ניתן לעבד את כמות הנתונים הזו בכאלף שעות מעבד, כך שזה קל מאוד. בקצב זה של התקדמות טכנית, ניכר כי תעשיית הגנום תעבד בקרוב אלפי גיגה-בייט תוך שניות ספורות.