أهداف تصميم قاعدة البيانات وعملية جرد البيانات

بما أن قاعدة البيانات العلائقية تحتوي على كمية ضخمة من البيانات الموزعة على جداول مربوطة فيما بينها، فمن الضروري جدا أن تمر عملية إنشائها بمعرفة مسبقة بشكل و هيكل كل جدول، عدد الأعمدة و تسمياتها و أنواع البيانات التي تحتوي عليها، و كذلك بالروابط التي تربطها ببعضها البعض، لذلك تحتم وجود دراسة يتم من خلالها استخراج البيانات التي يجب حفظها انطلاقا من العالم الحقيقي للنظام المعلومات قيد الدراسة و الرقمنة، تسمى هذه العملية تصميم البيانات.

1. أهداف تصميم قواعد البيانات

لعملية تصميم البيانات عدة أهداف أهمها:

1.1. تحديد الجداول

يتم استخراج تعداد الجداول و إعطاء تسمية لكل واحد منها.

2.1. توزيع البيانات على الجداول

و ذلك بعد جرد كل البيانات الضرورية التي يجب حفظها بدون تكرار و تقسيمها بدقة على مختلف الأعمدة المكونة للجداول مما يسهل عملية إدراجها و تحديثها و كذا البحث عليها واستخراجها بكل سهولة.

3.1. الربط بين الجداول

و ذلك بإيجاد روابط و علاقات منطقية تربط كل جدول بآخر مما يسهل عملية مزج البيانات و استخراج البيانات المعقدة من جدول لآخر.

4.1. القدرة على التطور

أي عملية استشراف للتطورات المستقبلية و ذلك بإضافة كل البيانات التي من الممكن أن نحتاج إليها مستقبلا و كذلك بالتوزيع الصحيح للبيانات على مختلف الجداول.

5.1. التواصل مع المسؤولين

يعتبر نموذج البيانات المفاهيمي وثيقة سهلة للتواصل الجيد بين القائمين على الرقمنة ومسؤولي المؤسسة أصحاب المشروع.

2. جرد و إحصاء البيانات

تتم عملية جرد و إحصاء كل البيانات الموجودة في المستندات المستعملة و السجلات و عن طريقة المقابلة التي يتم فيها طرح الأسئلة من قبل القائمين على الرقمنة على العمال و المسيرين التابعين للمؤسسة لتحديد احتياجاتهم و متطلباتهم.

1.2. قاموس البيانات الخام (Data Dictionary)

يتم تقييد جميع البيانات التي يتم جردها في جدول مرتب ترتيبا أبجديا يسمى "قاموس البيانات" (Data Dictionary) يضم أعمدة تحتوي على:

  • تسمية البيانات تستعمل التسمية المعطاة من قبل المؤسسة،
  • ترميز البيانات إعطاء رمز للبيانات يستعمل في الرقمنة،
  • تعريف البيانات أو دورها أو معناها أو ماذا تمثل بالنسبة للمؤسسة،
  • نوع و حجم البيانات أرقام، نصوص، تواريخ، ...، و أحجامها،
  • طريقة الحساب أو مجموعة القيم

2.2. تنقية قاموس البيانات

تم في الخطوة الأولى جرد و تقييد كل البيانات، لذلك توجب عملية تنقية هذه البيانات و ذلك بحذف البيانات المترادفة، البيانات المتعددة المعاني و البيانات التي يمكن حسابها.

1.2.2. البيانات المترادفة

هي البيانات التي تحمل تسميات مختلفة و لها نفس المعنى أي تدل على نفس البيانات لذلك وجب الاحتفاظ بواحدة فقط و حذف الباقي.

مثال:

  • نجد مثلا في قائمة السلع البيانات "مرجع السلعة" التي تدل على مرجع يعطى للسلعة لكي يمكن التفريق فيما بينها، بينما في الطلبية نجد نفس البيان مكتوب بالتسمية "رمز السلعة"، لذلك يجب حذف إحداهما و استعمال تسمية واحدة فقط في الحالتين.

2.2.2. البيانات المتعددة المعاني

هي البيانات التي لها نفس التسمية و تحمل معاني مختلفة لذلك يتوجب الاحتفاظ بها كلها مع تغيير التسميات.

مثال:

  • نجد في شهادة التسجيل التي تخص طالب البيانات "الاسم" و "اللقب" الخاصة بالطالب، كما نجد أيضا من خلال شهادة الوظيفة (العمل) الخاصة بأستاذ البيانات "الاسم" و "اللقب"، نلاحظ أن لهذه البيانات نفس التسمية و لكنها تدل على معاني مختلفة لذلك يجب كتابتها بالشكل التالي "اسم الطالب"، "لقب الطالب"، "اسم الأستاذ" و "لقب الأستاذ" حتى يتم التفريق فيما بينها.
  • نجد في قائمة السلع المخزونة البيان "الكمية" و التي تدل على الكمية المخزنة، كما نجد نفس التسمية "الكمية" في الطلبية و التي تدل على الكمية المطلوبة من قبل الزبون، لذلك وجب تغيير التسميات حتى تدل على المعنى الصحيح للبيانات مثلا "الكمية المخزنة" و "الكمية المطلوبة".

3.2.2. البيانات المحسوبة أو المستنتجة

هي البيانات التي يمكن حسابها أو استنتاجها انطلاقا من بيانات أخرى، لذلك وجب حذفها من قاموس البيانات على أن يتم التأكد جيدا من طريقة الحساب أو الاستنتاج و أن لا تتطلب وقتا طويلا لأجل ذلك.

مثال:

  • نجد مثلا البيانات التي تتعلق بالمعدلات ك "معدل المقياس"، فهذه الأخيرة يمكن حسابها انطلاق من النقاط "نقطة الموجه" و "نقطة الامتحان"، لذلك وجب حذفها و عدم الاحتفاظ بها.
  • نجد مثلا في الفاتورة المبالغ ك "مبلغ السلعة" التي يمكن حسابه انطلاقا من "سعر الوحدة" للسلعة و "الكمية المطلوبة"، لذلك وجب حذفها و عدم الاحتفاظ بها.

4.2.2. البيانات المركبة

هي البيانات التي تتألف من مجموعة من البيانات ك "العنوان" مثلا مركب من "رقم حي رمز بريدي تسمية المدينة" لذلك وجب تفكيكها للحصول على بيانات غير مركبة حسب الحاجة مثلا "رقم حي"، "رمز بريدي" و "تسمية المدينة".

5.2.2. قاموس البيانات الأساسية

بعد تنقية قاموس البيانات الخام و ذلك بحذف البيانات المترادفة، التفرقة بين البيانات المتعددة المعاني و استبعاد البيانات التي يمكن حسابها أو استنتاجها، نحصل في الأخير على قاموس البيانات الأساسية.


تعليقات

  1. أرجو من القراء الأعزاء تدوين تعليقاتهم وملاحظاتهم حتى يتم تحسين المحتوى

    ردحذف

إرسال تعليق

المشاركات الشائعة من هذه المدونة

نموذج البيانات المفاهيمي (Conceptual Data Model)

قواعد تحويل نموذج البيانات المفاهيمي إلى نموذج منطقي للبيانات