高哲技术博客 高哲技术博客
首页
编程
爬虫
运维
硬件
收藏
归档
关于

嘉美伯爵

前途光明,无需畏惧
首页
编程
爬虫
运维
硬件
收藏
归档
关于
  • 架构

  • 思想

  • 语言

  • 设计模式

  • 微服务

  • 数据分析

    • 基础

    • flink

    • spark

      • spark基础知识整理汇总
      • spark context整理及归纳
      • pyspark相关内容整理及归纳
        • 依赖文件
        • 原理
        • 参考
      • spark save mode整理及归纳
      • spark shell和sqark sql 控制台使用
      • spark on k8s原理学习
  • 人工智能

  • 区块链

  • 数据结构

  • 技术调研

  • 性能优化

  • 生产问题

  • 编程
  • 数据分析
  • spark
fovegage
2023-09-27
目录

pyspark相关内容整理及归纳

# 依赖文件

# spark on yarn 配置文件
https://spark.apache.org/docs/latest/configuration.html

# spark on k8s 配置文件
https://spark.apache.org/docs/latest/running-on-kubernetes.html#spark-properties

# --py-files 是指依赖的python单文件(也可以指定一个 pip包,但是不能指定虚拟环境)
spark/bin/spark-submit \
--master yarn  \
--deploy-mode cluster \
--py-files dependency.py \
script.py

# --files

# --archives

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 原理

# 由 py4j 进行运行
https://www.jianshu.com/p/eaab74e34dae
1
2

# 参考

https://blog.csdn.net/weixin_41002327/article/details/112252163
1
上次更新: 2023-10-13 14:07:43
spark context整理及归纳
spark save mode整理及归纳

← spark context整理及归纳 spark save mode整理及归纳→

最近更新
01
token embed和postion embed
06-10
02
k8s pod日志排查问题
10-24
03
golang内部私服建设方案
10-21
更多文章>
Theme by Vdoing | Copyright © 2018-2025 嘉美伯爵 | 鲁ICP备20001560号-4
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式