大数据 - 小智博客

Kafka知识点问题驱动式的回顾与复习——（一）

目录📖 前言一、Partition概念的诞生：解决热点IO问题1.1 问题背景1.2 解决方案：引入Partition二、Partition的有序性：局部有序，非全局有序2.1 Partition内部：严格有序2.2 Partition之间：无序2.3 设计权衡三、副本机制：Leade

大数据 2026年05月31日 113 点赞 0 评论 18984 浏览

Flink 日志怎么用从“找得到”到“看得懂”，再到“可检索可关联”

1、Flink 日志在哪里？怎么访问？ 1.1 日志文件来自哪些进程Flink 的每个进程都会产生日志文件，例如： JobManager（包含 Dispatcher、ResourceManager 等角色） TaskManager CLI / SQL Client / Session 启动脚本（ya

大数据 2026年05月31日 86 点赞 0 评论 11382 浏览

windows下RabbitMQ的使用(1)——下载与安装

一.RabbitMQ简介RabbitMQ 是一款开源、高性能、高可靠的消息队列中间件（Message Queue, MQ），基于 AMQP 0-9-1 协议，使用 Erlang 语言开发，主要用于分布式系统中的异步通信、应用解耦与流量削峰。 1.核心组件Producer (生产者)：消息的发送方，

大数据 2026年05月31日 193 点赞 0 评论 14319 浏览

基于Hadoop的网络舆情数据分析系统[python]-计算机毕业设计源码+LW文档

摘要：随着互联网的迅速发展，网络舆情数据呈现出爆炸式增长。基于Hadoop的网络舆情数据分析系统能够高效处理海量舆情数据，挖掘其中有价值的信息。本文详细阐述了该系统的设计与实现，包括系统架构、数据处理流程、功能模块等。通过实验验证，该系统在数据存储、处理速度和分析准确性方面表现出色，为网络舆情监测和分析提供了有效的

大数据 2026年05月30日 114 点赞 0 评论 10522 浏览

ODS到DWD数据清洗实战：基于Spark的高效ETL实现

ODS到DWD数据清洗实战：基于Spark的高效ETL实现引言一、ODS与DWD层概述 1.1 分层定义 1.2 清洗流程概览二、核心清洗操作详解 2.1 数据过滤 2.2 数据去重 2.2.1 去重策略选择 2.2.2 去重实现 2.3 空值处理 2.3.1 空值处理策略 2.3.2 空值处理实现 2.4 格式标准化

大数据 2026年05月30日 114 点赞 0 评论 7025 浏览

【大数据技术实战】大数据典型框架解析

前言在大数据技术飞速迭代的当下，从 Hadoop 生态到 Flink 实时计算，从离线数据仓库到实时推荐系统，技术理论与工具文档已不再稀缺，但 “如何将技术落地到真实业务”“如何解决实操中的各类坑”，仍是开发者面临的核心痛点。大数据技术实战类博客恰好填补了这一空白 —— 它以场景为锚点、以实操为核心&#xff0c

大数据 2026年05月30日 102 点赞 0 评论 11579 浏览

Flink技术实践-Flink指标监控全景指南

一、引言在离线任务的世界里，一个任务失败了，大不了重跑一次。但实时任务不同：数据在源源不断地流入，任何一个环节的阻塞都可能造成数据积压、延迟飙升，甚至整个集群雪崩。一个没有监控的Flink作业，本质上是一颗定时炸弹——它今天可能每秒处理百万条消息，明天就可能静默地落在后面，直到下游消费者

大数据 2026年05月30日 67 点赞 0 评论 2210 浏览

NVIDIA DGX Spark实战指南：从开箱到部署200B参数大模型

1. 开箱与初识：当超级计算走进你的桌面还记得几年前，想要跑一个像样的AI模型，要么得去租用昂贵的云端GPU实例，忍受网络延迟和排队等待，要么就得面对一台台嗡嗡作响、占地巨大的服务器机柜。那种感觉，就像你想喝杯水，却必须去管理一个水库。但今天，当我把NVIDIA DGX Spark从那个简约的牛皮纸盒里取出来时，这种印象被彻底颠覆了。它的尺寸，150mm x 150mm x 50.5mm，比一个i

大数据 2026年05月30日 196 点赞 0 评论 18027 浏览

2026技术趋势全景图：AI、云原生、大数据价值落地｜开发者学习路线

2026技术趋势全景图：AI重构开发范式后，开发者核心竞争力在哪？当 AI 能写代码、云原生变成默认配置、实时决策成为基础能力——2026 年，技术的“范式重构期”结束，“价值落地期”正式开始。本文适合所有想提前布局、不想被趋势甩下的开发者。开篇：2026，技术不再“炫技”过去两年，

大数据 2026年05月30日 168 点赞 0 评论 14013 浏览

消息队列Kafka/RocketMQ选型与高可用架构：从单体到100万TPS的演进

消息队列Kafka/RocketMQ选型与高可用架构：从单体到100万TPS的演进大家好，我是迪哥。从 2019 年到 2026 年，我们的消息队列架构换了三波——从 ActiveMQ 到 RocketMQ，再到 Kafka 与 RocketMQ 并存。今天就聊聊，什么时候用 Kafka，什么时候用 RocketM

大数据 2026年05月30日 45 点赞 0 评论 11352 浏览

大数据

首页

IT互联网

大数据

列表

默认

浏览次数

发布时间