אתר זה עושה שימוש בעוגיות על מנת להבטיח לך את חוויית הגלישה הטובה ביותר.
תחום ניהול המידע מתחמם: מי תשלוט בשוק של 40 מיליארד דולר? צילום: אוראל כהן

תחום ניהול המידע מתחמם: מי תשלוט בשוק של 40 מיליארד דולר?

העלייה המטאורית בכמות המידע דורשת טכנולוגיה יעילה לניהול ושליפת הנתונים. שחקניות חדשות יתקשו להתחרות ראש בראש בפתרונות ל־Big Data עם ענקיות מסדי הנתונים אורקל, יבמ ו־SAP. שתיים מהן מומלצות לקנייה כבר היום. כתבה שנייה בסדרה

24.04.2012, 07:42 | רמי רוזן ויוני אבישר

העלייה העצומה בכמות המידע ברשתות הנתונים העלתה את החשיבות של טכנולוגיה מהירה, יעילה ומהימנה להעברה ושליפה של אותם נתונים על גבי רשתות המידע, כאשר השיטות הישנות של אחסון וניהול נתונים הופכות להיות פחות רלבנטיות בהתמודדות עם עומס המידע.

בסיסי הנתונים פועלים במבנה טבלאי ועל פי הגדרות מובנות, אולם העידן הדיגיטלי מייצר בכמויות אקספוננציאליות ההולכות וגדלות מדי יום מידע "לא מובנה" (unstructured data), שלא ניתן לניהול בשיטות הישנות של בסיסי הנתונים. מדובר בדרך כלל במידע עשיר בטקסט דוגמת מסמכים שונים, קובצי וורד, מיילים, קובצי אודיו ווידיאו ועמודי web, אשר ניהול נכון שלו עשוי להניב לארגונים הכנסות נוספות מחד, וייעול תהליכים המוביל לקיטון בהוצאות מאידך.

ריבוי סוגי המידע וכמות המידע בבסיסי הנתונים השונים בארגונים דורשים מערכת שתדע לנהל אותם באופן מדויק, גמיש, מהיר ונגיש. האתגר שמציב תחום ה־Big Data - אחסון וניצול כמויות המידע הענקיות שמייצרים ארגונים — הוא איך לקחת מידע לא מובנה ולנהל אותו באותן איכויות הקיימות בעבור מידע שהוא מובנה ונשמר במערכות בסיסי נתונים.

טובעים במידע

לא ניתן לדבר על תחום ה־Big Data בלי להתייחס לתוצאות העסקיות של מלאנוקס מהשבוע שעבר (גילוי נאות: הראל פיננסים מכסה את המניה בהמלצת "תשואת יתר"). המערכות של מלאנוקס הן נדבך מרכזי במה שקשור לקישוריות מהירה ועם מינימום עיכובים בין שרתים. התוצאות בפועל, שהיו טובות משמעותית מהצפי של האנליסטים והתחזית האגרסיבית עוד יותר לרבעון השני, הם המרכיבים שמגרים את דמיונם של המשקיעים בתחום ה־Big Data.

בעלת המניות העיקרית ולקוחה גדולה של מלאנוקס היא חברת אורקל, אחת החברות הבולטות זה שנים בתחום מערכות בסיסי הנתונים, לצד יבמ ו־SAP.

ביבמ פותחה לראשונה שפת התכנות של בסיסי הנתונים שנקראת SQL בתחילת שנות השבעים, ולקראת סוף אותו עשור פיתחה אורקל גרסה משלה לשפת ה־SQL.

 , צילום: בלומברג צילום: בלומברג  , צילום: בלומברג

מערכות בסיסי הנתונים האלה היו טובות, ועדיין טובות כדי להתמודד עם כמויות המידע המובנה שניתן לשמור במבנה טבלאי ולנהל אותו באמצעות אותם כלים. אבל העלייה המטאורית בכמות המידע הלא מובנה (ההערכה היא שכ־80% מן המידע הדיגיטלי בעולם המיוצר על ידי ארגונים ועסקים הם מהסוג הזה) יוצרת צורך לפתח טכנולוגיות ומערכות ניהול חדשות כדי להתמודד עם הבעיה הקריטית של עומס המידע, שמירתו ועיבודו.

אחת הפלטפורמות העיקריות שבאות "לעשות סדר" בעולם הנתונים הלא מובנה נקראת Hadoop. מדובר בסט של כלי תוכנה שצמח מתוך כלי האינדקס של גוגל ומיועד לעולם של ריבוי שרתים וביצוע משימות עיבוד נתונים באופן מקביל. היכולת של Hadoop טובה להתמודדות עם מידע לא מובנה ונחשבת ליעילה ביותר לפתרון בעיות של Big Data.

חברות כמו פייסבוק, יאהו וטוויטר עושות שימוש מרכזי בטכנולוגיית Hadoop לצורך ניהול, ארגון וקטלוג הכמות העצומה של מידע בלתי מובנה שהן יוצרות באופן רציף ושנמצא בשרתים שלהם.

לדוגמה, כאשר אנחנו מחפשים משהו בגוגל, מנוע החיפוש כבר סרק את כל אתרי האינטרנט שקיימים וקטלג את הנושא שאנחנו מחפשים לפי התוצאות הרלבנטיות ביותר. לכן, כאשר אנחנו מקישים את מילות החיפוש, יעלו לנו מיד התוצאות ולא נצטרך לחכות זמן רב עד שגוגל יסרוק את כל האתרים בחיפוש אחר הנושא שבחרנו.

אותו עיקרון מיושם היום בארגונים. הארגון מבקש לקטלג ולארגן את כל המידע שנשמר אצלו במטרה לנתח אותו ולשלוף ממנו אינפורמציה חשובה בבוא העת. כך, לדוגמה, אם הארגון יסרוק ויקטלג את כל המיילים של העובדים, הוא יוכל בזמן אמת לחסום מיילים שאסור להפיץ מחוץ לארגון.

שולטות בשוק

סוגיה נוספת שממחישה את כמות המידע שנוצרת ואת חשיבותם העתידית של פתרונות ה־Big Data בתחום מסדי הנתונים היא החשש שבקרוב מאוד כמות הנתונים שנוצרת תעקוף את ההיצע הפיזי של אמצעי האחסון, והמגמה הזאת תלך ותעמיק עם הזמן. על רקע זה ברורה חשיבותם של מערכות חדשות לניהול הנתונים, ניתוחם ושמירתם.

על פי הערכות בענף ה־IT, ההיקף הכספי של ההזדמנות העסקית העומדת בפני החברות בתחום מערכות ניהול מסדי הנתונים מוערך ב־40 מיליארד דולר.

להערכתנו, בגלל החשיבות של ניהול פתרונות ה־Big Data, לצד המערכות הוותיקות של מסדי הנתונים, החברות שמובילות כיום את תחום מסדי הנתונים, כגון אורקל ויבמ, יובילו את שוק פתרונות ה־Big Data שישתלבו בפתרונות הקיימים ויעבדו זה לצד זה. לחברות שאינן מתמחות במסדי נתונים יהיה קשה לחדור לארגונים עם פתרונות חלקיים בלבד, בשל הצורך לשלב בין מערכות ניהול הנתונים והרצון לעבוד באותה סביבת עבודה מוכרת מהעולם הישן של מסדי הנתונים.

אורקל ממוצבת היטב בשוק ה־Big Data, שיגדל להיקפים של 100 מיליארד דולר בתוך כמה שנים, כיוון שהיא מאמצת פתרונות חדשים ומרחיקי לכת שמשתלבים עם עולם מסדי הנתונים הקיים, ובכך מאפשרת לארגונים המשכיות למוצרים הנוכחיים. אורקל מציעה סל מוצרים רחב לעולם ה־Big Data, המאפשרים לאסוף, לארגן ולנתח את המידע. ההבדלים בין המערכות של אורקל למתחרות טמונים במהירות ובנוחות של המערכות, ובעיקר בעובדה שמערכות בסיסי הנתונים שלה מותקנות אצל יותר מ־280 אלף לקוחות ולכן קל לה למכור להם מוצרים נוספים לצד המוצרים הוותיקים.

למרות הפוטנציאל הגדול שלה, אורקל נסחרת במכפיל נמוך של 12 לשנה הקרובה ובשווי שוק של 143 מיליארד דולר.

ניצחון המכונה

שחקנית מרכזית נוספת בתחום היא יבמ. לרוב, כאשר רוצים לתת דוגמה ליכולות של טכנולוגיית ה־Big Data, משתמשים בסיפור על מערכת המחשב Watson שפיתחה יבמ בשנים האחרונות, אשר ניצחה בשנה שעברה את שני אלופי משחק ה־Jeopardy כאשר ענתה בהצלחה על יותר שאלות משני אלופי המשחק שמולם התחרתה.

הניצחון המרשים של ה־Watson יכול להוות ציון דרך בשאלה האם האינטליגנציה של המכונות תעבור את האינטליגנציה של בני האדם. מערכת ה־Watson ידעה לקחת כמויות מידע אדירות ולנתח אותן בעזרת שילוב כמה טכנולוגיות של Big Data, כמו למשל Hadoop ו־Machine Learning.

ליבמ סל הפתרונות הרחב ביותר לעולם ה־Big Data. החברה נחשבת לשחקן השני אחרי אורקל בשוק מסדי הנתונים וגם לה אפליקציות רבות לתחום ה־Big Data שיושבות על פלטפורמת מסד הנתונים ויודעות לעבוד בצמוד אליו.

לדעתנו, יבמ לא יקרה ונסחרת במכפיל 13 לשנה הנוכחית. החברה יושבת עמוק בתוך הארגונים שלהם היא מוכרת וקשה יהיה להחליף את הפתרון הכולל שיבמ נותנת במוצר חלקי של מתחרה, מה שהופך גם אותה למומלצת בשוק ה־Big Data.

השורה התחתונה

מניות יבמ ואורקל נסחרות היום במחיר לא גבוה (מכפיל 12 ו־13 ל־2012, בהתאמה) למרות הפוטנציאל הגדול שלהן בשוק ה־Big Data

רמי רוזן מנהל את מחלקת המחקר Sell Side בהראל פיננסים. יוני אבישר הוא מנהל קרנות חו"ל בהראל פיא

תגיות