Bigdata البيانات الضخمة “منجم الذهب الجديد”
البيانات الضخمة ” Bigdata منجم الذهب الجديد”
علاء الدين الحجي
ما هي البيانات الضخمة Bigdata؟
تعتبر البيانات الضخمة من أهم المواضيع التي يتم طرحها ومناقشتها في الوقت الحالي على مستوى العديد من الصناعات والمجالات الاقتصادية المختلفة وكما يطلق عليه البعض “منجم الذهب الجديد”، ففي مجال تقنية المعلومات، يطلق مصطلح Big Data على مجموعة من حزم البيانات الضخمة جدًا والمعقدة والتي يصعب التعامل معها بواسطة نظم إدارة قواعد البيانات (DBMS) التقليدية من ناحية التخزين، البحث والتمثيل. تنقسم البيانات الضخمة إلى ثلاث أنواع:
-
البيانات المنظمة (Structured Data):
البيانات المنظمة هي البيانات التي يمكن معالجة عناصرها من أجل التحليل الفعال. ,وعادة ما تكون منسقة في قواعد بيانات على شكل صفوف وأعمدة. لديهم مفاتيح ترابط (relational keys) ويمكن بسهولة إعادة تصميم وتعيين هذا النوع من البيانات في مجالات مصممة مسبقًا. تتم معالجة هذه البيانات بشكل كبير في التطوير وتعتبر من أبسط البيانات التي يمكن معالجتها وإدارتها.
-
البيانات شبة المنظمة (Semi Structured Data):
البيانات شبه المنظمة هي المعلومات التي لا توجد في قاعدة بيانات مترابطة ولكن لها بعض الخصائص التنظيمية التي يسهل تحليلها. على سبيل المثال في بعض العمليات، يمكن تخزين البيانات الشبه منظمة في قاعدة بيانات مترابطة ولكن ليس بالسهولة ذاتها كما هي الحالي في البيانات المنظمة، وتعتبر بيانات XML أحد الأمثلة على هذا النوع من البيانات.
-
البيانات الغير منظمة (Unstructured Data):
هي بيانات غير منظمة بطريقة محددة مسبقًا أو لا تحتوي على نموذج بيانات محدد مسبقًا ، وبالتالي فهي ليست مناسبة لقاعدة بيانات مترابطة. لذلك يوجد منصات بديلة لتخزين وإدارة هذا النوع من البيانات، وهي منتشرة بشكل متزايد في أنظمة تكنولوجيا المعلومات وتستخدمها المؤسسات في مجموعة متنوعة من تطبيقات ذكاء الأعمال والتحليلات. وتعتبر ملفات Word، PDF، Textوسجلات الوسائط من أنواع البيانات الغير منظمة.
تطور البيانات الضخمة Big Data على مستوى العالم
على المستوى العالمي، يتوقع المعهد الوطني للمعايير والتكنولوجيا وهي وكالة أمريكية تعمل مع قطاع الصناعة على تطوير وتطبيق التكنولوجيا والمقاييس والمعايير أنه سوف يتم إنتاج نحو 7 زيتابايت من البيانات خلال عام 2014 (1 زيتابايت يعادل 1 مليار جيجابايت). وبحلول عام 2018م، من المتوقع أن يولد كل هاتف ذكي 2 جيجابايت من البيانات شهريًا.
ويعزى هذا النمو المتسارع في البيانات الضخمة إلى انتشار الاعتماد على الأجهزة والأنظمة المتصلة بالإنترنت، والتحول الى التقنيات الرقمية في كافة المجالات وأهمها تقديم الخدمات الحكومية والخاصة للمتعاملين، كذلك نجد أنّ حصة إنتاج البيانات الغير منظمة (Unstructured Data) عبر وسائل التواصل الاجتماعي ومقاطع الفيديو والصور هي حاليًا أكبر من حصة البيانات المنظمة (ٍStructured Data). ومع تطور التكنلوجيا وقدرات أجهزة الحواسيب ازدادت القدرة على معالجة البيانات بشكل كبير؛ حيث يمكن الآن إجراء تحليلات معقدة على مجموعات كبيرة جدًا من البيانات. فالبيانات التي كان ينظر إليها سابقًا وكأنها غير مهمة، يمكن الآن أن تضيف معلومات غاية في الأهمية عند دمجها مع بيانات من مصادر أخرى.
من الضروري جدا أن تبدأ المؤسسات وبشكل فعلي في الاستفادة من بيانات التي يتم تخزينها بشكل أفضل، حيث يمثل ميزة كبيرة لأي مؤسسة. وربما كانت فرص ابتداع أفكار ورؤى جديدة من خلال تحليلات البيانات الضخمة أكثر وضوحًا في القطاعات التي تتمتع بكثافة البيانات، مثل الرعاية الصحية والمرافق العامة والنقل والتعليم والمالية والعلوم والحكومة. وبتعزيز فهمها لعملائها ومستخدمي خدماتها، يمكن لهذه المؤسسات أن تقدم خدمات أفضل وأكثر كفاءة لعملائها.
يمكن لتحليلات البيانات الضخمة أن تضيف قيمة كبيرة للمؤسسة، من المهم تحديد العمليات التي ستوفر رؤى وأفكارًا شاملة ودقيقة وقابلة للتنفيذ. ومن المتوقع توفير الكثير من الوقت والمال في حالة تطبيق المؤسسات والجهات الحكومية ممارسات إدارة البيانات التي تراعي المتطلبات المحددة لتحليل البيانات الضخمة. كذلك يمكن للبيانات المستمدة من مصادر مختلفة داخل أو خارج المؤسسة أن تضيف قيمة كبيرة لوظائف متعددة ولأغراض متعددة، لذلك فإن المؤسسات التي ستعمل بشكل جدي على استغلال البيانات الضخمة في تحسين خدماتها وزيادة نسبة أرباحها هي المؤسسات التي ستأخذ الحصة الأكبر من منجم الذهب الجديد (البيانات الضخمة).