大数据 - 小智博客

详解RabbitMQ工作模式之简单模式

目录简单模式定义工作流程应用场景优点缺点小结使用案例引入依赖编写生产者代码创建连接创建Channel声明一个队列发送消息释放资源整体代码管理界面观察队列消息编写消费者代码创建连接+创建Channel+声明队列消费消息释放资源整体代码运行程序原因分析及解决办法简单模式定义简单模式（Queue模式）是RabbitMQ中最基础的消息传递模式。在这种模

大数据 2025年05月23日 44 点赞 0 评论 14239 浏览

大数据（7.4）Kafka存算分离架构深度实践：解锁对象存储的无限潜能

目录一、传统架构的存储困境与破局 1.1 数据爆炸时代的存储挑战 1.2 存算分离的核心价值矩阵二、对象存储集成架构设计 2.1 分层存储核心组件 2.2 关键配置参数优化三、深度集成实践方案 3.1 冷热数据分层策略 3.1.1 存储策略性能对比 3.2 跨云数据湖方案四、企业级应用案例 4.1 金融交易审计系

大数据 2025年07月28日 140 点赞 0 评论 14217 浏览

Rabbitmq的三个端口区分

1. 端口5672 功能：这是AMQP（高级消息队列协议）的默认端口。用途：主要用于RabbitMQ客户端和服务器之间的通信，包括消息的发送和接收等操作。它是RabbitMQ进行消息传递的核心端口。 2. 端口15672 功能：这是RabbitMQ管理界面的默认端口。用途：通过浏览器可以访问该端口

大数据 2025年05月20日 32 点赞 0 评论 14144 浏览

在自然语言处理（NLP）领域，实体抽取和关系提取是两个重要的任务。实体抽取用于从文本中识别出具有特定意义的实体（如人名、地名、组织名等），而关系提取则用于识别实体之间的关系。本文将通过一个基于 Apache Spark 和 Spark NLP 的示例，展示如何实现中文文本的实体抽取和关系提取。一、技术栈介绍1. Apache SparkApache Spark 是一个分布式计算框架，广泛用于大规模

大数据 2025年04月26日 58 点赞 0 评论 14137 浏览

《旅游行业接口数据落地 Hive ODS 表全流程实战！从采集到分区一站搞定》

🏖️ 旅游行业数据中台实战：接口数据如何高效落地 Hive ODS 表？ ✍️ 作者：大数据狂人｜大数据架构师十年数仓与实时计算架构经验，擅长旅游、电商、政务数据中台建设。本文将从接口采集 → 数据解析 → Hive ODS 落地 → 分区维护，一步步带你完成旅游行业的真实数据落地案例。一、

大数据 2025年11月30日 91 点赞 0 评论 14076 浏览

大数据浪潮下，解锁智算云平台实操密码

目录蓝耘 GPU 智算云平台：开启 AI 算力新征程前期准备：注册与登录注册流程登录步骤登录注意事项实例创建：挑选合适的算力选择 GPU 资源选择操作系统镜像设置实例名称和密码创建实例的具体操作步骤环境搭建：代码环境初构建（一）连接计算实例（二）安装系统依赖库（三&#xff

大数据 2025年06月01日 53 点赞 0 评论 14039 浏览

五、Hadoop集群部署：从零搭建三节点Hadoop环境（保姆级教程）

作者：IvanCodes 日期：2025年5月7日专栏：Hadoop教程前言： 想玩转大数据，Hadoop集群是绕不开的一道坎。很多小伙伴一看到集群部署就头大，各种配置、各种坑。别慌！这篇教程就是你的“救生圈”。一、磨刀不误砍柴工：环境准备（虚拟机与网络&#x

大数据 2026年02月02日 160 点赞 0 评论 14016 浏览

2026技术趋势全景图：AI、云原生、大数据价值落地｜开发者学习路线

2026技术趋势全景图：AI重构开发范式后，开发者核心竞争力在哪？当 AI 能写代码、云原生变成默认配置、实时决策成为基础能力——2026 年，技术的“范式重构期”结束，“价值落地期”正式开始。本文适合所有想提前布局、不想被趋势甩下的开发者。开篇：2026，技术不再“炫技”过去两年，

大数据 2026年05月30日 168 点赞 0 评论 14013 浏览

使用 PySpark 从 Kafka 读取数据流并处理为表

使用 PySpark 从 Kafka 读取数据流并处理为表下面是一个完整的指南，展示如何通过 PySpark 从 Kafka 消费数据流，并将其处理为可以执行 SQL 查询的表。 1. 环境准备确保已安装: Apache Spark (包含Spark SQL和Spark Streaming) Kafka PySpark 对应的Kafka连接器 (通常已包含在Spark

大数据 2025年09月09日 85 点赞 0 评论 14001 浏览

Hadoop•HDFS的Java API操作

听说这是目录哦上传文件到HDFS🌈 一、下载Windows版本的JDK和Hadoop 二、配置物理机环境变量三、创建项目四、添加依赖五、新建java类六、创建文件七、打开集群八、选中、运行从HDFS下载文件🪐 一、写代码二、HDFS要个文件三、物理机要个文件夹（目录） 四、运行代码

大数据 2025年05月25日 64 点赞 0 评论 13975 浏览

大数据

首页

IT互联网

大数据

列表

默认

浏览次数

发布时间