التقنيات الأساسية في خدمة GaussDB(DWS)

تستخدم خدمة GaussDB(DWS) بنية موزعة لا تدعم مشاركة الموارد وتدعم التخزين الهجين للصفوف والأعمدة، فضلًا عن توافرها العالي وموثوقيتها وأمانها وذكائها.

بنية لا تدعم مشاركة الموارد

كل قاعدة بيانات (عقدة بيانات أو DN) في خدمة GaussDB(DWS) تمتلك وحدة معالجة مركزية وذاكرة ومساحة تخزين خاصة بها. ولا تتم مشاركة أي هذه الموارد.

تضمن بنية المعالجة المتوازية على نطاق واسع (MPP) التي لا تدعم مشاركة الموارد الوصول الكامل إلى موارد وحدة المعالجة المركزية والإدخال/الإخراج والذاكرة، وتُحسّن الأداء بشكلٍ خطي مع توسيع حجم موارد تقنية التجميع، ما يوفر الدعم لما يصل إلى بيتابايتات من البيانات.

التخزين الموزع

تقسم خدمة GaussDB(DWS) الجداول أفقيًا حيث توزع الصفوف عبر العقد وفق سياسة توزيع محددة مُسبقًا. ويمكنك في الاستعلامات تصفية البيانات غير الضرورية والعثور بسرعة على البيانات التي تحتاجها.

كما تقسم خدمة GaussDB(DWS) أيضًا بيانات الجداول إلى نطاقات غير متداخلة.

يوفر التقسيم الامتيازات الموضحة في الجدول الآتي.

الجدول 2-1 امتيازات التقسيم

السيناريو
الامتياز

الصفوف التي يتم الوصول إليها بشكلٍ متكرر تتواجد في قسم واحد أو بضعة أقسام من البيانات.

نطاق البحث أقل بشكلٍ كبير وأداء الوصول أفضل.

يتعين الاستعلام عن معظم السجلات الموجودة في أحد الأقسام أو تحديثها.

تحسن الأداء إلى حدٍ كبير، حيث يتم فحص الأقسام المحددة فقط بدلًا من الجدول بأكمله.

السجلات التي يتعين تحميلها أو حذفها على دفعات تتواجد في قسم واحد أو بضعة أقسام من البيانات.

تحسن أداء معالجة البيانات إلى حدٍ كبير، حيث يقتصر الوصول أو الحذف على بضعة أقسام فحسب من الجدول. ويمكنك بذلك تجنب العمليات المتناثرة.

يوفر تقسيم البيانات الامتيازات الآتية:

  • إدارة أفضل

تقسيم الجداول والفهارس إلى وحدات أصغر يسهل إدارتها. ويساعد ذلك مسؤولي قواعد البيانات على إدارة البيانات وفقًا للأقسام. كما يمكن تنفيذ الصيانة لأجزاء محددة من الجدول بشكلٍ منفصل.

  • حذف أسرع

يُعد حذف قسم أسرع وأكثر كفاءة من حذف صفوف فردية.

  • استعلام أسرع

يمكنك اتباع الطرق الآتية لتضييق نطاق البيانات التي يتعين فحصها أو العمل عليها:

­‏- تقليم الأقسام:‏

يعني تقليم الأقسام أو استبعادها تقليل عدد الأقسام التي يتعين على عقد التنسيق (CN) البحث فيها. وتساعد هذه الميزة على تحسين أداء الاستعلامات وتقليل الوقت المستغرق فيها.

­‏- ربط الأقسام:‏

يمكن أن يُحسّن ربط الأقسام من الأداء في حال دمج جدولين أحدهما مقسم حسب مفتاح الربط على الأقل. حيث يعمل ربط الأقسام على تقسيم الروابط الكبيرة لمجموعة البيانات "المتطابقة" إلى روابط أصغر. وتشير كلمة "المتطابقة" هنا إلى تماثل مجموعة قيم مفتاح التقسيم في كلا الجانبين. علمًا بأنه يتم استخدام هذه المجموعات فقط للربط.

الحوسبة المتوازية الكاملة

تستخدم خدمة GaussDB(DWS) مجموعة من محركات التنفيذ الموزعة للاستفادة الكاملة من الموارد وتعزيز الأداء إلى أقصى حد ممكن.

الشكل 2-1 الحوسبة المتوازية الكاملة في خدمة GaussDB(DWS)

التقنيات الأساسية للحوسبة المتوازية الكاملة في خدمة GaussDB(DWS) الموضحة في الصورة أعلاه هي كالتالي:

  • ‏MPP: توازن العقد

يتيح إطار عمل التنفيذ الموزع مع بروتوكول التحكم بالنقل (TCP) الخاص بمساحة المستخدم لمعالجة حزم المتجهات (VPP) تشغيل أكثر من 1,000 خادم بشكلٍ متوازٍ مع عشرات الآلاف من وحدات المعالجة المركزية.

  • المعالجة المتعددة المتماثلة (SMP): توازن المشغلات

يمكن تقسيم جملة لغة استعلامات مهيكلة (SQL) إلى مؤشرات ترابط متعددة تعمل بشكلٍ متوازٍ. ويمكن استخدام المعالجات متعددة الأنوية والوصول غير الموحد إلى الذاكرة (NUMA) لتسريع العمليات.

  • تعليمة واحدة لبيانات متعددة (SIMD): توازن التعليمات

يمكن تنفيذ تعليمة x86 أو Arm على سجلات البيانات على دفعات.

  • التحويل البرمجي الديناميكي لبرنامج الآلة الافتراضية منخفضة المستوى (LLVM)

يمكن استخدام تقنية LLVM لإنشاء رمز آلي وفقًا للوظائف الرئيسية، مما يقلل عدد التعليمات اللازمة لتنفيذ SQL لتسريع المعالجة.

التخزين الهجين للصفوف والأعمدة والتنفيذ المتجهي

في خدمة GaussDB(DWS)، يمكنك استخدام تخزين الصفوف أو الأعمدة لجداولك، كما هو موضح في الشكل الآتي.

الشكل 2-2 محرك التخزين الهجين للصفوف والأعمدة في خدمة GaussDB(DWS)

يسمح تخزين الأعمدة بضغط البيانات القديمة وغير النشطة لتوفير المساحة، وتقليل تكاليف شراء المعدات والتشغيل والصيانة. تدعم تقنية ضغط تخزين الأعمدة في خدمة GaussDB(DWS) خوارزميات مثل تشفير دلتا وضغط القاموس وRLE وLZ4 وZLIB، ويمكنها الاختيار التلقائي لخوارزميات الضغط بناءً على خصائص البيانات. يبلغ متوسط نسبة الضغط 1:7. ويمكن الوصول إلى البيانات المضغوطة دون فك ضغطها ويمكن للخدمات من الوصول إليها بيسرٍ وسهولة. وهذا يؤدي إلى تقليل وقت انتظار الوصول إلى البيانات القديمة بشكلٍ كبير.

يمكن للمنفذ المتجهي لخدمة GaussDB(DWS) معالجة عدة صفوف في نفس الوقت، مما يحسن كفاءة العملية إلى حد كبير. وعند الاستعلام عن جداول تخزين الصفوف والأعمدة في الوقت نفسه، يمكن لخدمة GaussDB(DWS) التبديل تلقائيًا بين محركات تخزين الصفوف والأعمدة لتحقيق أداء مثالي.

الجاهزية العالية للخوادم الأساسي/الاحتياطي/الثانوي

في نظام النسح المزدوج التقليدي، الذي يتألف من خادم أساسي وآخر احتياطي، إذا حدث خطأ في أحد الخادمين، فسيواصل الآخر تقديم الخدمات لكنه سيحتفظ فقط بنسخة واحدة من البيانات. وإذا تعطل هذا الخادم أيضًا، فستُفقد هذه النسخة إلى الأبد. يمكنك إنشاء نظام ثلاثي النسخ لتجنب هذه المشكلة، لكن ذلك سيكلفك مزيدًا من مساحة التخزين. ولتقليل تكاليف التخزين، تستخدم خدمة GaussDB(DWS) آلية الجاهزية العالية للخوادم الأساسي/الاحتياطي/الثانوي. حتى إذا تعطل أحد الخوادم، فلا يزال هناك نسختان متوفرتان من البيانات. يحقق هذا الخيار نفس مستوى موثوقية البيانات تقريبًا كنظام النسخ الثلاثي، ولكن مع الحاجة إلى ثلثي مساحة التخزين المطلوبة فقط.

الشكل 2-3 النسخ الاحتياطي الأساسي/الاحتياطي/الثانوي

كما هو موضح في هذا الشكل، تستخدم خدمة GaussDB(DWS) خوادم أساسية واحتياطية وثانوية. وعندما تعمل هذه الخوادم بشكلٍ سليم، تقوم الخوادم الأساسية والاحتياطية بالمزامنة القوية من خلال تدفقات السجلات وتدفقات صفحات البيانات. يتصل الخادم الأساسي بالخادم الثانوي لكن دون إرسال سجلات أو بيانات إليه، بحيث لا يستنفد الخادم الثانوي موارد التخزين. لكن إذا تعطل الخادم الاحتياطي، فسيرسل الخادم الأساسي إلى الخادم الثانوي أيّة سجلات وبيانات لم تتم مزامنتها بعد. يبدأ الخادم الأساسي بعد ذلك في إجراء المزامنة القوية إلى الخادم الثانوي. يتم تنفيذ هذا التبديل في الأنوية ولا يؤثر في العمليات. ولن تحدث أيّة أخطاء أو مشكلات عدم تطابق.

إذا تعطل الخادم الأساسي، فإن مكون مدير تقنية التجميع يعمل على ترقية الخادم الاحتياطي ليصبح الخادم الأساسي. وسيبدأ الخادم الأساسي الجديد في إجراء المزامنة القوية إلى الخادم الثانوي. بهذه الطريقة، إذا تعطلت إحدى عقد البيانات في مجموعة عقد البيانات، فستظل هناك نسختان متوفرتان من البيانات لضمان موثوقية البيانات.

التوسع عبر الإنترنت

يمكن لتقنية تجميع واحدة في خدمة GaussDB(DWS) أن تضم ما يصل إلى 2,048 عقدة. كما يمكن تحسين قدرات التخزين والحوسبة الخاصة بها بشكلٍ خطي عن طريق إضافة المزيد من العقد.

تتيح تقنية مجموعة العقد في خدمة GaussDB(DWS) توسيع الموارد لعدة جداول بشكلٍ متوازٍ مع سرعة تصل إلى 400 غيغابايت في الساعة على كل عقدة جديدة. يوضح الشكل الآتي عملية توسع الموارد.

الشكل 2-4 عملية توسع الموارد

يتمتع توسع الموارد في خدمة GaussDB(DWS) بالميزات الآتية:

  • استمرارية الخدمة

عمليات استيراد البيانات والاستعلامات لا تتوقف أثناء التوسع.

  • التجزئة المستمرة والتوسيع المتوازي متعدد الجداول

تقلل التجزئة المستمرة من كمية البيانات التي بتم ترحيلها خلال إعادة التوزيع.

يمكن إعادة توزيع جداول متعددة بشكل متوازٍ. ويمكن تحديد تسلسل إعادة التوزيع.

يمكنك التحقق من سير عملية توسيع الموارد.

  • زيادة الأداء الخطية

تتميز خدمة GaussDB(DWS) ببنية موزعة متوازية بالكامل. الأمر الذي يحسّن من أداء تحميل البيانات ومعالجة الخدمات ومساحة التخزين لتقنية التجميع بشكل خطي عند إضافة المزيد من العقد.

شفافية الأمان

تدعم خدمة GaussDB(DWS) تشفير البيانات الشفاف (TDE). فلا تتأثر تجربة المستخدم بالتشفير أو فك التشفير. تمتلك كل تقنية من تقنيات التجميع مفتاح تشفير عنقودي (CEK). تُشفّر كل قاعدة بيانات باستخدام مفتاح تشفير قاعدة بيانات (DEK) مستقل. ويُشفّر مفتاح تشفير قاعدة البيانات باستخدام مفتاح التشفير العنقودي لتعزيز الأمان. يمكنك استخدام بروتوكول Kerberos للتقدم بطلبات على المفاتيح وتشفيرها وفك تشفيرها وتكوين خوارزميات التشفير من خلال عناصر التكوين بطريقة موحدة. تدعم الخدمة حاليًا خوارزميتي AES وSM4. كما تدعم خوارزمية التشفير SM4 تسريع الأجهزة في شرائح Hi1620 والإصدارات اللاحقة.

نحن نساعدك على استخراج القيمة من خلال استخدام تحليلات البيانات الضخمة مع حماية الخصوصية في نفس الوقت. يمكنك تحديد السياسات لإخفاء أعمدة معينة وحماية البيانات الحساسة. وبعد تطبيق سياسة إخفاء البيانات، لن يتمكن أحد من الوصول إلى البيانات الأصلية سوى المسؤول ومالك الجدول. لا يؤثر الإخفاء في معالجة البيانات. ويمكن استخدام البيانات المخفية في عمليات الحوسبة. علمًا بأن البيانات ستُخفى فقط عندما تعرض قاعدة البيانات النتائج.

يوضح الشكل الآتي مثالًا على تقنية إخفاء البيانات. تم تحويل البيانات الحساسة مثل رواتب الموظفين وعناوين بريدهم الإلكتروني وأرقام هواتفهم المحمولة إلى علامات x لحماية الخصوصية.

الشكل 2-5 نتائج إخفاء البيانات

تتضمن التقنيات الرئيسية المستخدمة في إخفاء البيانات ما يلي:

  • النطاق المحدد من قِبل المستخدم

يمكنك تنفيذ جمل لغة تعريف البيانات (DDL) لتطبيق سياسات إخفاء البيانات على أعمدة محددة.

  • السياسات المحددة من قِبل المستخدم

يمكنك تخصيص وظائف إخفاء البيانات وفقًا لوظائف الإخفاء المدمجة للبيانات من نوع الأرقام والأحرف والوقت.

  • التحكم بالوصول

بعد إخفاء البيانات، لن يتمكن أحد من الاطلاع على البيانات سوى المسؤول ومالك الجدول.

  • توافر البيانات

يمكن استخدام البيانات المخفية في عمليات الحوسبة، ولكنها ستُخفى عندما تعرض قاعدة البيانات النتائج.

التشخيص الذاتي للغة SQL

 توفر خدمة GaussDB(DWS) تحليلًا ذكيًا لمشكلات الأداء أثناء تنفيذ استعلامات لغة SQL، بحيث يتم تسجيل المشكلات وعرضها بطريقة سهلة الفهم. يمكنك بسهولة معرفة كيفية تحسين جمل لغة SQL للارتقاء بمستوى الأداء. وذلك نظرًا لأن الضبط التقليدي لأداء لغة SQL في قواعد البيانات الموزعة معقدًا وصعبًا. كما يتطلب استكشاف الأخطاء وإصلاحها بشكلٍ فعال مهارات وخبرة مهنية واسعة.

الشكل 2-6 كيفية عمل التشخيص الذاتي للغة SQL