spark
차이
문서의 선택한 두 판 사이의 차이를 보여줍니다.
| 양쪽 이전 판이전 판다음 판 | 이전 판 | ||
| spark [2016/08/25 05:27] – [설치] rex8312 | spark [2024/03/23 02:38] (현재) – 바깥 편집 127.0.0.1 | ||
|---|---|---|---|
| 줄 116: | 줄 116: | ||
| # Initialize PySpark to predefine the SparkContext variable ' | # Initialize PySpark to predefine the SparkContext variable ' | ||
| - | execfile(os.path.join(spark_home, | + | # execfile(os.path.join(spark_home, |
| + | exec(open(os.path.join(spark_home, | ||
| </ | </ | ||
| 줄 123: | 줄 124: | ||
| ipython notebook --profile=pyspark | ipython notebook --profile=pyspark | ||
| # jupyter notebook --profile=pyspark | # jupyter notebook --profile=pyspark | ||
| + | |||
| + | |||
| + | ===== Cluster 설정 ===== | ||
| + | |||
| + | - 마스터와 슬레이브에 spark 설정 | ||
| + | - 마스터에서 슬레이브로 암호없이 ssh 연결 가능하도록 설정 | ||
| + | - /etc/hosts 파일 수정 후 재부팅 | ||
| + | - 127.0.1.1 주석 처리, 슬레이브에서 마스터로 연결 거부 될 수 있음 | ||
| + | - 각 호스트의 주소와 이름을 입력 | ||
| + | - 연결이 거부될 경우 telnet {master ip} 7077로 연결 테스트 할 수 있음 | ||
| + | |||
| + | 클러스터 시작 및 종료 | ||
| + | |||
| + | $SPARK_HOME/ | ||
| + | $SPARK_HOME/ | ||
| + | | ||
| + | |||
| + | - 클러스터 상태 페이지: http:// | ||
| + | - 성공적으로 클러스터가 실행중이라면, | ||
| + | - http:// | ||
| + | | ||
| + | 클러스터에 접속 | ||
| + | |||
| + | pyspark --master spark:// | ||
| + | | ||
| + | | ||
spark.1472102869.txt.gz · 마지막으로 수정됨: (바깥 편집)