python mapreduce



Python hadoop streaming:設置一個作業名稱 (1)

使用-D key = value表示法配置屬性:

-D mapred.job.name='My Job'

您只需使用-info參數調用流式jar即可列出大量選項

  • 我有一個工作,使用hadoop流在我的集群上運行
  • 我必須開始一個新的工作,我想添加一個工作名稱,我怎樣才能通過命令行或文件來設置一個工作名稱的選項?
  • 在Java中,你可以這樣說
JobConf conf = new JobConf(WordCount.class);
conf.setJobName("wordcount");

我怎樣才能做到這一點與hadoop流?





hadoop-streaming