pig (41)


Séparation des entrées dans les sous-chaînes de PIG(Hadoop)

Séparation des entrées dans les sous-chaînes de PIG(Hadoop)

Supposons que j'ai la saisie suivante dans Pig: some Et je voudrais convertir cela en: s so som some Je n'ai pas(encore) trouvé un moyen d'itérer sur un chararray en cochon latin. J'ai trouvé…


hadoop - Pig Latin: charge plusieurs fichiers à partir d'une plage de dates(partie de la structure de répertoires)

J'ai le scénario suivant-Version porcine utilisée 0.70 Exemple de structure de répertoire HDFS:/user/training/test/20100810/<data files>/user/training/test/20100811/<data files>/user/traini…


hadoop - La ruche a-t-elle une fonction de scission de chaîne?

Je recherche une fonction de fendage de chaînes intégrée dans Hive? Par exemple, si String est A | B | C | D | E alors je veux avoir une fonction comme le tableau split(entrée de chaîne, délim…


Hadoop Pig: passage d'arguments de ligne de commande

Y a-t-il un moyen de faire cela? par exemple, passer le nom du fichier à traiter, etc.…



permissions - Problème d'autorisations Apache Pig

J'essaie de lancer Apache Pig sur mon cluster Hadoop et je rencontre un problème de permissions. Pig lui-même est en train de se lancer et de se connecter au cluster, à partir du shell Pig, je peux…


RavenDb MapReduce sur un sous-ensemble de données

Dire que j'ai la structure de document donnée dans RavenDb public class Car{public string Manufacturer{get;set;} public int BuildYear{get;set;} public string Colour{get;set;} pu…


hadoop - sélectionnez le compte distinct en utilisant le cochon latin

J'ai besoin d'aide pour ce script de cochon. Je viens de recevoir un seul enregistrement. Je sélectionne 2 colonnes et fait un compte(distinct) sur un autre tout en utilisant également une clause…


hadoop - PIG comment compter un nombre de lignes dans un alias

J'ai fait quelque chose comme ça pour compter le nombre de lignes dans un alias dans PIG: logs=LOAD 'log' logs_w_one=foreach logs generate 1 as one; logs_group=group logs_w_one all; logs_count…


hadoop - Différence entre les paquets serde2.objectinspector et typeinfo

Quelle est la différence entre ces deux paquets: org.apache.hadoop.hive.serde2.objectinspector org.apache.hadoop.hive.serde2.typeinfo Est-ce qu'une nouvelle API? Sont-ils à la fois actuels, m…


hadoop - Comment puis-je extraire le premier tuple d'un sac généré(dont la taille peut varier) en PIG?

Je génère un «sac» d'informations dont la taille(nombre de tuples à l'intérieur du sac) peut varier. De cela, je veux extraire le premier élément à la volée. Comment puis-je faire cela?…




tutorial apache hive data big hadoop mapreduce sql shadow requete