大数据

2025最新版flink2.0.0安装教程(保姆级)

Flink支持多种安装模式。local(本地)——本地模式standalone——独立模式,Flink自带集群,开发测试环境使用standaloneHA—独立集群高可用模式,Flink自带集群,开发测试环境使用yarn——计算资源统一由Hadoop YARN管理,生产环境测试flink1.13 &#x

详解RabbitMQ高级特性之TTL

目录TTL添加配置常量类消息的TTL声明队列和交换机并绑定二者关系编写生产消息代码生产消息队列的TTL声明队列和交换机并绑定二者关系编写生产消息代码生产消息(消息无TTL)生产消息(消息有TTL)消息的TTL和队列的TTLTTL TTL(Time to Live, 过期时间), 即过期时间. RabbitMQ可以对消息和队列设置TTL.

时序数据库选型指南:基于大数据视角的IoTDB应用优势分析详解!

目录一、时序数据库选型的基本原则1.1 数据特征与需求分析1.1.1 数据规模与写入负载1.1.2 查询需求1.1.3 数据保留与归档策略1.1.4 系统扩展性与高可用性1.2 技术架构与系统性能评估1.2.1 写入性能1.2.2 查询性能1.2.3 数据压缩能力1.2.4 高可用性与灾备能力1.3 成本与TCO(总拥有成本)二、IoTDB的优势与应用2.1 IoTDB

Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用(278)

       💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程&#xff0

大数据计算资源基础知识,以及5个核心技术讲解(hadoop、mapreduce、hive、spark、flink)

大数据计算资源基础知识 大数据处理基本背景大数据处理面临的主要挑战是数据量太大,无法在单台机器上高效处理。因此,需要分布式系统将数据和计算任务分散到多台机器上协同完成。根据处理方式和应用场景的不同,发展出了不同类型的计算资源。 批处理计算资源背景:最早的大数据处理方式,主要处理已经存储好的大量历史数据。 MapReduce&

Hive的分区分桶和数据抽样

文章目录 分区 概念 分区表的操作 创建分区表 新建分区 导入数据到指定分区 写入数据到指定分区 删除分区 删除多个分区 查看分区 查看分区表结构 动态分区 1. 开启动态分区参数设置 2. 设置为非严格模式 3. 设置所有节点可创建的最大分区数 4. 设置单个节点可创建的最大分区数 5.设置整个MRJob可创建的最大文件数 6. 设置当有空分区产生时是否报错&#x

Spark的shuffle史上最详细解析 , 应用场景等多维度

以下内容将对 Spark 中 Shuffle 的原理、流程、配置项、实际应用场景、常见问题及解决方案等进行全面、详细、细致的分析和阐述,并在必要处辅以示例和配置展示。最后会进行总结,同时给出项目中可能出现的场景、问题、优化方式,力求内容完善、翔实且具有可操作性。 一、Shuffle 的背景与概念 什么是 Shuffle? 在分布式计算框架&

基于大数据爬虫+Python+SpringBoot+Hive的网络电视剧收视率分析与可视化平台系统(源码+论文+PPT+部署文档教程等)

 博主介绍:CSDN毕设辅导第一人、全网粉丝50W+,csdn特邀作者、博客专家、腾讯云社区合作讲师、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、P

Flink-sql-整理-窗口函数

1 窗口表值函数(Windowing TVFs)1.滚动窗口 2.滑动窗口 3.累积窗口 4.会话窗口 (目前仅支持流模式)**简述:**逻辑上,每个元素可以应用于一个或多个窗口,这取决于所使用的 窗口表值函数。例如:滑动窗口可以把单个元素分配给多个窗口。是 分组窗口函数 (已经过时)