51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

数据库

PySpark 使用 OR 运算符在筛选中

PySpark 使用 OR 运算符在筛选中

厉飞雨 阅读(17) 评论(0) 赞(0)

英文: PySpark using OR operator in filter 问题 {#heading} ============= 这个过滤器有效: `raw_df_2 = raw_df_1.filter(array_contains(col("country.state.city"), 'San Diego&...

Spark驱动程序意外停止(Databricks)

Spark驱动程序意外停止(Databricks)

厉飞雨 阅读(16) 评论(0) 赞(1)

英文: Spark driver stopped unexpectedly (Databricks) 问题 {#heading} ============= 我在Azure Databricks中有一个Python笔记本,其中包含一个包含137次迭代的for循环。对于每次迭代,它使用`dbutils.notebook.run`调用另一个Scala笔记本。Scala笔记...

spark-joy

spark-joy

厉飞雨 阅读(45) 评论(0) 赞(1)

> 死非生的对立面,而作为生的一部分永存。------《挪威的森林》 ✨? 2000 多种方法为您的产品增添设计风格、用户满意度和奇思妙想。 <https://github.com/swyxio/spark-joy/> ![图片](http://static.51tbox.com/static/2024-12-09/col/dfbeb8db8aaf2c0...

spark安装与部署

spark安装与部署

厉飞雨 阅读(22) 评论(0) 赞(0)

为了防止不必要的报错,部署之前请务必从开头开始看,切勿跳过其中一个部署模式,因为每一个部署模式都是从上一个模式的配置上进行的 环境说明 {#环境说明} ------------ * `hadoop-2.7.5` * `jdk1.8.0_181` * `Scala` * `spark-3.3.0-bin-hadoop2` 下载地址: {#下载地址:} -----------...

Git笔记

Git笔记

厉飞雨 阅读(28) 评论(0) 赞(1)

Git介绍 {#Git介绍} -------------- * Git是分布式版本控制系统 * 集中式VS分布式,SVN VS Git 1. SVN和Git主要的区别在于历史版本维护的位置 2. Git本地仓库包含代码库还有历史库,在本地的环境开发就可以记录历史而SVN的历史库存在于中央仓库,每次对比与提交代码都必须连接到中央仓库才能进行。 3. 这样的好处在于:...

Git配置修改

Git配置修改

厉飞雨 阅读(30) 评论(0) 赞(1)

通过命令修改 {#%E9%80%9A%E8%BF%87%E5%91%BD%E4%BB%A4%E4%BF%AE%E6%94%B9} ---------------------------------------------------------------- > 配置全局的用户名(--global此电脑所有git仓库都会使用该配置) ```shell git con...

.gitignore文件不生效

.gitignore文件不生效

厉飞雨 阅读(32) 评论(0) 赞(0)

如果.gitignore文件没有生效,可能有以下几个原因 {#%E5%A6%82%E6%9E%9C.gitignore%E6%96%87%E4%BB%B6%E6%B2%A1%E6%9C%89%E7%94%9F%E6%95%88%EF%BC%8C%E5%8F%AF%E8%83%BD%E6%9C%89%E4%BB%A5%E4%B8%8B%E5%87%A0%E4%B8%AA%E5%8...