hive डेटा पर एक हाइव टेबल कैसे बनाया जाए जिसे '^ P' सीमांकक द्वारा अलग किया गया है




hiveql serde (2)

मेरी क्वेरी है:

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '^P';

(मुझे यकीन नहीं है कि '^ P' को एक सीमांकक के रूप में इस्तेमाल किया जा सकता है लेकिन इसे करने की कोशिश की गई है)

परिणाम, सभी क्षेत्रों को 'कोई नहीं' दिखा रहा है जब मैं हाइव टेबल में डेटा लोड करता हूं

डेटा दिखता है:

4307421698 ^ P200 ^ P138193920770 ^ P2017-03-08 02: 46: 18.021204 ^ P2017-03-08 02: 46: 18.021204

कृपया मेरी मदद करें।


^P का आक्टल मूल्य 020 प्रयत्न,

CREATE EXTERNAL TABLE gateway_staging (
  poll int,
  total int,
  transaction_id int,
  create_time timestamp,
  update_time timestamp
  )
  ROW FORMAT DELIMITED FIELDS TERMINATED BY '\020';

यहां विकल्प दिए गए हैं:

  • ... fields terminated by '\020' (अक्तूबर) ... fields terminated by '\020'
  • ... fields terminated by '16' (दशमलव) ... fields terminated by '16'
  • ... fields terminated by '\u0010' (हेक्साडेसिमल) ... fields terminated by '\u0010'

कृपया ध्यान दें कि यूनिकोड लीटरल्स ('\ u0010') से जुड़ी एक बग है जो 2.1 संस्करण में तय किया गया है, इसलिए 3 विकल्प का उपयोग करते हुए पहले के संस्करणों पर काम नहीं करेगा https://issues.apache.org/jira/browse/HIVE-13434