51工具盒子

依楼听风雨
笑看云卷云舒,淡观潮起潮落

软件教程

十亿条数据需要每天计算怎么办?Spark快速入门

十亿条数据需要每天计算怎么办?Spark快速入门

厉飞雨 阅读(39) 评论(0) 赞(4)

[#](#一-概述) (一)概述 {#一-概述} ------------------------ 前段时间公司规划了一个新的项目,我成了这个项目的负责人。在做技术选型时,有一个需求阻碍了前进的步伐。大概有十亿条数据,数据总量在六百G左右,这些海量的数据需要每天根据一定的逻辑计算得到几千万的值。当数据量达到这种程度时,Java应用已经无法支撑了,于是在技术选型时选中了大数据计...

ElasticSearch集群升级方案

ElasticSearch集群升级方案

厉飞雨 阅读(47) 评论(0) 赞(4)

[#](#前言) 前言 {#前言} ----------------- 之前项目里用的ES一直是7.6.2版本,后来得到通知需要将集群升级到7.17.13,因此写下这篇文章做个记录。 [#](#前期准备) 前期准备 {#前期准备} ----------------------- 升级版本:7.6.2 -\> 7.17.13 机器数量:三台Linux服务器组成的集群...

学会RDD就学会了Spark,Spark数据结构RDD快速入门

学会RDD就学会了Spark,Spark数据结构RDD快速入门

厉飞雨 阅读(46) 评论(0) 赞(3)

[#](#一-概述) (一)概述 {#一-概述} ------------------------ Spark计算框架封装了三种主要的数据结构:RDD(弹性分布式数据集)、累加器(分布式共享只写变量)、广播变量(分布式共享支只读变量) [#](#二-rdd) (二)RDD {#二-rdd} --------------------------- RDD:弹性分布式数据集是...

大数据场景下的消息队列:Kafka3.0快速入门

大数据场景下的消息队列:Kafka3.0快速入门

厉飞雨 阅读(42) 评论(0) 赞(4)

[#](#一-什么是kafka) (一)什么是Kafka {#一-什么是kafka} ------------------------------------------ Kafka是一个分布式的基于**发布/订阅模式**的消息队列,同时它又是一个分布式的事件流平台。既可作为消息队列,又可作为数据管道、流分析的应用。目前Kafka的最大应用还是消息队列。 市面上主流的消息队...

像写SQL一样去处理内存中的数据,SparkSQL入门教程

像写SQL一样去处理内存中的数据,SparkSQL入门教程

厉飞雨 阅读(26) 评论(0) 赞(4)

[#](#一-概述) (一)概述 {#一-概述} ------------------------ SparkSQL可以理解为在原生的RDD上做的一层封装,通过SparkSQL可以在scala和java中写SQL语句,并将结果作为Dataset/DataFrame返回。简单来讲,SparkSQL可以让我们像写SQL一样去处理内存中的数据。 Dataset是一个数据的分布式集...

Kafka生产者是如何发送消息的?

Kafka生产者是如何发送消息的?

厉飞雨 阅读(27) 评论(0) 赞(4)

[#](#一-生产者的原理) (一)生产者的原理 {#一-生产者的原理} ------------------------------------ 当有数据要从生产者发往消费者的时候,在kafka底层有这样一套流程。首先生产者调用send方法发送消息后,会先经过一层拦截器,接着进入序列化器。序列化器主要用于对消息的Key和Value进行序列化。接着进入分区器选择消息的分区。 ...

MongoDB快速上手,聊聊这款火了一阵又销声匿迹的非关系型数据库

MongoDB快速上手,聊聊这款火了一阵又销声匿迹的非关系型数据库

厉飞雨 阅读(31) 评论(0) 赞(3)

[#](#概述) 概述 {#概述} ----------------- 事情的起因要从最近的一个新产品说起,最近部门有一个新的大数据产品规划,在考虑技术实现时,有一个动态表字段扩展的需求,比如原来表结构里只有a、b字段,需要不断的往里新增c、d、e等等字段,并且数据量也特别大。 于是就去寻找实现方案,针对这种数据模型无法确定的情况,非关系型数据库是比较合适的,于是找到了Mo...

Netty线程模型!

Netty线程模型!

厉飞雨 阅读(49) 评论(0) 赞(4)

嗨,你好呀,我是**猿java** Netty 是一个基于 Java 的高性能网络应用框架,其核心是一个强大的异步事件驱动的网络应用框架,支持 TCP、UDP 和 HTTP 协议。这篇文章,我们将深入探讨 Netty 的线程模型,包括其原理、示例、使用场景以及优缺点。 整体来说,Netty 提供了3种线程模型:单线程模型、Reactor多线程模型和 Reactor主从多线程...

Kubernetes可以替代openstack吗

Kubernetes可以替代openstack吗

厉飞雨 阅读(31) 评论(0) 赞(3)

openstack-可以将物理机分配为若干虚拟机 k8s,是特长服务调度。 ### Kubernetes可以替代openstack吗 Kubernetes 和 OpenStack 是两个不同的技术,不能完全替代彼此。OpenStack 是一个基础设施即服务 (IaaS) 平台,主要用于管理物理和虚拟资源,如计算、存储和网络等。而 Kubernetes 是一个容器编排平...

cAdvisor 容器监控神器

cAdvisor 容器监控神器

厉飞雨 阅读(28) 评论(0) 赞(4)

[一文详解Docker容器监控神器:cAdvisor、node exporter、prometheus-CSDN博客](https://blog.csdn.net/Long_xu/article/details/129478370)