apache-spark 351

  1. Spark DataFrame에 상수 컬럼을 추가하는 방법?
  2. Spark - 앱을 제출할 때 '구성에 마스터 URL을 설정해야합니다.'오류가 발생했습니다.
  3. PySpark에서 py4j.java_gateway를 찾을 수없는 이유는 무엇입니까?
  4. 스파크 자바 프로그램을 실행하는 법
  5. Apache Spark : Python 3에서 pyspark를 사용하는 방법
  6. Spark RDD에서 요소에 고유 한 연속 번호를 할당하는 방법
  7. Spark에서 Executor 메모리와 드라이버 메모리를 다루는 방법?
  8. java.io.IOException : Hadoop 바이너리에서 실행 파일 null \ bin \ winutils.exe를 찾을 수 없습니다. 윈도우 7에 이클립스 스파크
  9. Apache Spark : 값을 저장하기 위해 RDD를 키로 여러 RDD로 분할
  10. 명령 줄에서 Spark 예제의 마스터 주소를 설정하는 방법
  11. Spark의 캐싱 이해
  12. Spark : RDD가 비어 있는지 테스트하는 효율적인 방법
  13. spark.sql.shuffle.partitions의 최적 값은 무엇이 아니면 Spark SQL을 사용할 때 파티션을 어떻게 늘릴 수 있습니까?
  14. Apache Spark를 사용하여 여러 하이브 상점에서 쿼리하기
  15. 스파크 데이터 프레임에서 여러 열을 선택하는 목록 업 채우기
  16. reduceByKey 메서드가 스칼라 스파크에서 발견되지 않습니다.
  17. Spark가 S3의 쪽매 파일에 대한 열 스캔을 지원합니까?
  18. RDD를 캐쉬 해제하는 방법?
  19. 작업이 "장치에 남은 공간 없음"으로 인해 실패하지만 df가 다르게 말하는 이유는 무엇입니까?
  20. Python / pyspark로 graphx를 실행하려면 어떻게해야합니까?
  21. Spark - 직렬화 할 수없는 작업 : 클래스 / 객체 외부에서 호출하는 복잡한지도 닫기 작업 방법?
  22. 스파크 : RDD [X]에서 모든 가능한 조합의 RDD [(X, X)]를 생성합니다.
  23. RDD를 업데이트하는 방법?
  24. 단위 테스트에서 Spark 로깅을 억제하는 방법?
  25. sc.textFile을 사용하여 하위 디렉토리에서 파일 내용을 재귀 적으로 가져옵니다.
  26. csv에 pyspark에서 테이블 데이터 프레임을 내보내는 방법?
  27. Spark 데이터 프레임 컬럼에서 최대 값을 얻는 가장 좋은 방법
  28. 스파크 체크 포인트와 디스크 지속성의 차이점은 무엇입니까?
  29. 없음 값이있는 Pyspark 데이터 프레임 열 필터링
  30. Spark-SQL에서 사용자 정의 함수 만들기
  31. spark-ml을 사용하여 범주 형 기능을 처리하는 방법은 무엇입니까?
  32. pyspark 문자열을 날짜 형식으로 변환하십시오.
  33. apache spark MLLib : 문자열 기능에 대해 레이블이 지정된 점을 만드는 방법은 무엇입니까?
  34. Spark SQL이있는 /없는 두 개의 일반 RDD 결합
  35. 드라이버별로 Spark의 log4j.properties를 재정의하는 방법은 무엇입니까?
  36. 활성 작업은 Spark UI에서 음수입니다.
  37. Spark - "sbt 패키지"- "value $는 StringContext의 멤버가 아닙니다"- 누락 된 스칼라 플러그인?
  38. 열 길이를 사용하여 DataFrame 필터링
  39. 모든 작업자에게 정적 객체를 갖는 올바른 방법은 무엇입니까?
  40. CrossValidatorModel에서 최상의 매개 변수를 추출하는 방법
  41. Spark Standalone : 클라이언트 배포 모드와 클러스터 배포 모드의 차이점
  42. 큐브와 groupBy 연산자의 차이점은 무엇입니까?
  43. Spark 데이터 세트로 스칼라에서 유형이 지정된 조인을 수행합니다.
  44. Kryo 직렬화를 사용할 때 Spark의 성능이 저하되는 이유는 무엇입니까?
  45. StreamingContext를 시작하면 "IllegalArgumentException : 요구 사항이 실패했습니다 : 등록 된 출력 작업이 없으므로 아무 것도 실행하지 않습니다."
  46. Spark : 시간 범위별로 RDD에 가입하는 방법
  47. Python으로 IPython 셸을로드하는 법
  48. 파켈 메타 데이터 파일을 롤백해야합니까?
  49. pandas 데이터 프레임을 zeppelin에서 데이터 프레임을 시작하도록 변환
  50. Pyspark와 PCA : 어떻게이 PCA의 고유 벡터를 추출 할 수 있습니까? 그들이 설명하는 분산을 어떻게 계산할 수 있습니까?