hadoop - मैं किसी हाइव व्यू में कॉलम को कैसे अस्पष्ट कर सकता हूं?



md5 hive (1)

कुछ विकल्प:

  • आईडी को अपने दृश्य में शामिल न करें:

    कुछ "संवेदनशील आईडी" का चयन करें, संवेदनशील_टेबल से मूल्य देखें;

  • अगर आपको अभी भी प्रत्येक अभिलेख के लिए एक विशिष्ट कुंजी उपलब्ध होने की आवश्यकता है, तो आप जो बदलाव चाहते हैं, उसे करने के लिए यूडीएफ लिख सकते हैं:

    ADAR JAR mycode.jar; अस्थायी फ़ंक्शन हश को 'com.example.MyUDF' के रूप में बनाएं; SELECT hash (id) के रूप में कुछ देखें, संवेदनशील_table से मान;

  • बोनस: अपने उपयोगकर्ताओं के रूप में देखकर आप संवेदनशील तालिका को वैसे भी देख सकते हैं, हो सकता है कि आप हाइव में पहुंचने से पहले आईडी को हेश कर सकें? यह शायद सबसे अच्छा विकल्प ईमानदारी से है

किसी भी तरह से, यदि आप आईडी की प्रक्रिया कर रहे हैं, तो एक स्थिर हैशिंग फ़ंक्शन होने पर आपको क्या चाहिए अगर लोगों को अभी भी शामिल होने / एकत्रीकरण आदि के लिए आईडी पर भरोसा करना होगा।

यहां एक यूडीएफ बनाने का लिंक है

मैंने तालिका के लिए एक दृश्य बनाया है:

CREATE VIEW anonymous_table
AS SELECT id, value FROM sensitive_table

और संवेदनशील तालिका के id क्षेत्र को किसी भी तरह से अस्पष्ट किया जा सकता है, जैसे कि एक एमडी 5 हैश या कुछ इसी तरह से ताकि लोगों को देखने के लिए क्वेरी वास्तविक id को नहीं देख सकें। हाइव में ऐसा करने का एक अच्छा तरीका क्या है?