cassandra - كورايما - مسلسل كاسندرا كامل مدبلج



الاستعلام أقسام تقسيم على كاساندرا في طلب واحد (1)

أساسا هذا ينخفض ​​إلى اختيار القرار الصحيح للبيانات الخاصة بك. أود أن أقول الخطوة الأولى بالنسبة لك أن يكون لتحديد ما هو الأنسب لبياناتك. دعونا من أجل سبيل المثال تأخذ 1 ساعة كما شيء جيد والسؤال هو كيفية جلب جميع السجلات لتاريخ معين.

سيكون منطق التطبيق الخاص بك أكثر تعقيدا قليلا منذ كنت تتداول البساطة القدرة على تخزين كميات كبيرة من البيانات في الأزياء الموزعة. كنت تأخذ التاريخ الذي تحتاجه وإصدار 24 الاستعلامات في حلقة والغراء البيانات على مستوى التطبيق. ولكن عندما كنت الغراء في يمكن أن تكون ضخمة (أنا لا أعرف العرض التقديمي أو متطلبات التصدير حتى هذا يمكن سحب 1M إلى الذاكرة).

فكرة أخرى يمكن أن يكون وجود جدول واحد كما جدول بحث بسيط الذي لديه مفتاح من تاريخ وقيم مفاتيح التقسيم وجود بيانات مالية لهذا التاريخ. من عند قراءتك تذهب أولا إلى جدول بحث للحصول على مفاتيح ومن ثم إلى أقسام وجود نتائج. يمكنك أيضا تخزين عداد القيم لكل مفتاح التقسيم حتى تعرف مقدار البيانات التي تتوقعها.

الكل في كل شيء هو أفضل لمعرفة بعض دلو الطبيعي في مجموعة البيانات الخاصة بك وإضافته حتى الآن (المنظمة، والرمز البريدي الخ) ويمكنك استخدام خدعة مع جدول بحث إضافية. يمكن استخدام هذا النهج للرمز الذي ذكرته. يمكن أن يكون لديك رموز كمفاتيح تقسيم، تجميع لكل تاريخ وقيم أقسام لها نتائج لذلك التاريخ كقيم. من الاستعلام عن رمز # في 29-10-2015 وترى أقسام A و D و Z لها نتائج لذلك تذهب إلى تلك الأقسام والحصول على البيانات المالية منها والغراء معا على مستوى التطبيق.

أنا في عملية التعلم كاساندرا كبديل لقواعد بيانات سكل لأحد المشاريع التي أعمل بها، والتي تنطوي على البيانات الكبيرة.

لغرض التعلم، لقد تم مشاهدة أشرطة الفيديو التي تقدمها داتاستاكس، وعلى وجه التحديد DS220 الذي يغطي بيانات النمذجة في كاساندرا.

أثناء مشاهدة واحدة من أشرطة الفيديو في سلسلة بالطبع أنا عرضت على مفهوم تقسيم الأقسام لإدارة حجم القسم.

فهمي الحالي هو أن كاساندرا لديها قدرة منطقية كحد أقصى من الإدخالات 2B لكل قسم، ولكن الحد الأقصى المقترح من الزوجين 100s لكل قسم.

أنا حاليا التعامل مع كميات كبيرة من البيانات المالية في الوقت الحقيقي التي يجب أن تخزين (سلسلة زمنية)، وهذا يعني أنني يمكن أن تملأ بسهولة قيمة البيانات الشخصية في يوم واحد.

وتتحدث دورة الفيديو عن إدخال مفتاح تقسيم إضافي من أجل تقسيم قسم مع الغرض أو تقليل حجم كل متطلبات القسم. وأشار الفيديو إلى استخدام إما مفتاح يستند إلى الوقت أو مفتاح "دلو" التعسفي الذي يحصل على زيادة عندما تم التوصل إلى عدد من الصفوف يمكن التحكم فيها.

مع هذا في الاعتبار، وهذا أدى لي إلى المشكلة التالية: نظرا لأن مفاتيح التقسيم تستخدم فقط كمعايير المساواة (أي نقطة إلى قسم للعثور على السجلات)، كيف يمكنني العثور على جميع السجلات التي تنتشر في نهاية المطاف عبر أقسام متعددة دون الحاجة إلى تحديد إما دلو أو مفتاح الطابع الزمني؟

على سبيل المثال، قد أتلقى سجلات 1M في يوم واحد، والتي من المرجح أن تذهب على حدود القسم 100-500Mb، لذلك أنا لن تكون قادرة على تعيين قسم على أساس التاريخ، وهذا يعني أن البيانات اليومية سيكون مقسمة إلى أقسام كل ساعة، أو بدلا من ذلك، إلى أقسام "دلو" (لأحجام التقسيم المتوازن). وهذا يعني أن جميع البيانات اليومية ليتم نشرها عبر تقسيمات متعددة الأقسام.

بالنظر إلى هذا السيناريو، كيف يمكنني الاستعلام عن جميع السجلات ليوم معين؟ (يمكن أن تتضمن مفاتيح تجميع إضافية رمزا أريد الحصول على نتائجه، أو أريد جميع السجلات لهذا اليوم المحدد)

أي مساعدة سيكون موضع تقدير كبير.

شكرا لكم.