大数据

计算机毕业设计Hadoop+Spark+DeepSeek-R1大模型民宿推荐系统 hive民宿可视化 民宿爬虫 大数据毕业设计(源码+文档+PPT+讲解)

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、

一文带你学会zookeeper(了解、安装、集群、使用)

概述:         1、zookeeper是一个开源的分布式的服务协调框架(Apache项目)         2、zookeeper从设计模式的角度来理解:是一个基于观察者模式的分布式服务管理框架,他负责存储和管理大家都关心的数据,然后接收观察者的注册,一旦这些数据发生变化,zoo

window下安装并启动kafka

进入Kafka官网:Apache Kafka下载最新版Kafka 2.将Kafka路径配置到windows环境变量下(KAFKA_HOME),并将其添加到path中(方法同上) 3.进入E:\midware\kafka_2.13-3.9.0,创建2个自定义文件夹mydata,mylog 4.修改zk的配置文件

YARN架构解析:深入理解Hadoop资源管理核心

YARN架构解析:深入理解Hadoop资源管理核心 🌟 你好,我是 励志成为糕手 ! 🌌 在代码的宇宙中,我是那个追逐优雅与性能的星际旅人。 ✨ 每一行代码都是我种下的星光,在逻辑的土壤里生长成璀璨的银河; 🛠️ 每一个算法都是我绘制的星图,指引着

【Rabbitmq篇】高级特性----TTL,死信队列,延迟队列

目录一.TTL        1.设置消息的TTL2.设置队列的TTL3.俩者区别 二.死信队列定义:消息成为死信的原因:1.消息被拒绝(basic.reject 或 basic.nack)2.消息过期(TTL)3.队列达到最大长度 ​编辑 死信队列的应用场景三.延迟队列  定义:应用场景 实现一&#

高效查询Redis中大数据的实践与优化指南

个人名片 🎓作者简介:java领域优质创作者 🌐个人主页:码农阿豪 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[2435024119@qq.com] 📱个人微信:15279484656 &#x1f310

Spark RDD 编程从驱动程序到共享变量、Shuffle 与持久化

1. Spark 应用的基本形态 Driver(驱动程序):运行你的 main 函数,负责构建 DAG、提交任务、汇总结果。 Executors(执行器):分布在集群各节点,执行并行任务。 RDD(Resilient Distributed Dataset&#xff

【大数据毕设】基于spark与机器学习的肺癌风险评估与可视化分析系统|基于Hadoop和python的肺癌数据挖掘与智能预测系统

💕💕作者:计算机源码社 💕💕个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Spark、hadoop、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流! 💕&#x1f

Docker安装Kafka(不依赖ZooKeeper)

创建docker-compose.yamlversion: "3.9" #版本号 services: kafka: image: apache/kafka:3.9.0 container_name: kafka hostname: kafka ports: - 9092:9092 # 容器内部之间使用的监听端口 - 9