غير مصنف

ما هي بحيرة البيانات؟


بحيرة بيانات محددة

يتضمن بحيرة البيانات يحتوي على كمية كبيرة من البيانات الخام وغير المهيكلة بتنسيقها الأصلي.

لذلك كل ما تحتاجه هو جهاز يدعم نظام ملفات ثابت ، مما يعني أنه يمكنك استخدام حاسب مركزي إذا أردت. يتم نقل البيانات إلى خوادم أخرى للمعالجة.

تستخدم معظم الشركات نظام ملفات Hadoop (HDFS) ، لأنه مصمم للمعالجة السريعة لمجموعات البيانات الكبيرة ويستخدم في بيئة البيانات الضخمة حيث من المحتمل أن يتم استخدام بحيرة البيانات.

هذا الدعم لبيانات التنسيق الأصلي يجلب فائدة كبيرة ، وهي أنه إذا كنت أرغب في الحصول على الكثير من البيانات ومعرفة ما يجب فعله بها لاحقًا ، فهذا يناسب شعار ما تفعله بحيرات البيانات الآن.

تفترض Data Lake كل ما يمكن أن يكون مضحكًا أو غبيًا أو حتى غير مفهوم ، لا يمكننا تخمين قيمة تلك المعلومات ونعلم أهميتها اليوم ، ولكن في المستقبل قد تكون مهمة جدًا.

هذا يعني أنه إذا لم تكن متأكدًا من الوقت الذي ستستخدم فيه البيانات وليس من المهم أن يكون لديك وصول ثانوي وتريد تخزينها في نموذج منخفض التكلفة، فإن بحيرة البيانات هي الحل الأفضل، إنها غالبًا ما تعمل بشعار إذا لم تقم بتجميع البيانات الآن فلن تحصل عليها أبدًا مرة أخرى.

  • بحيرة البيانات مقابل مستودع البيانات

مستودعات البيانات إنها ليست جديدة ، فقد كانت مستودعات البيانات موجودة منذ عقود ، وعلى الرغم من أنه من الطبيعي مقارنة مستودعات البيانات ببحيرات البيانات ، إلا أن هناك اختلافات جوهرية تفصل مستودعات البيانات عن بحيرات البيانات ، من نوع البيانات المخزنة إلى طريقة معالجتها.

أحد الاختلافات الرئيسية بين بحيرة البيانات ومستودع البيانات هو أن بحيرة البيانات لا تتطلب أجهزة أو برامج خاصة على عكس مستودع البيانات.

ما هي بحيرة البيانات؟


السابق
لغز من سور القران من 5 حروف لعبة وصلة
التالي
عدد طلاب الثانوية العامة 2021 في لجان الامتحانات وكثافتها