【大数据技术基础 | 实验十二】Hive实验:Hive分区 文章目录 一、实验目的 二、实验要求 三、实验原理 四、实验环境 五、实验步骤 (一)启动Hadoop集群 (二)用命令进入Hive客户端 (三)通过HQL语句进行实验 六、实验结果 七、实验心得 一、实验目的掌握Hive分区的用法,加深对Hive分区概念的理解 大数据 2025年12月14日 177 点赞 0 评论 12936 浏览
Hive 4.1.0的安装与部署 1.下载安装介质下载地址: (或者可以访问官网选择其他版本 #xff09;在安装Hive之前,需要确认已经安装了 Hadoop sudo tar -zxvf ./apache-hiv 大数据 2025年12月14日 189 点赞 0 评论 14034 浏览
01 | Hive SQL执行步骤 Hive SQL 的执行过程是将用户编写的类 SQL 语句(HiveQL)转化为底层可执行的计算任务(如 MapReduce、Tez 或 Spark),并在 Hadoop 生态中完成数据处理。整个流程可分为 6 个核心步骤,体现了 Hive “SQL → 逻辑计划 → 物理计划 → 分布式执行” 的编译与优化思想。 大数据 2025年12月14日 70 点赞 0 评论 8405 浏览
【推荐系统】深度学习训练框架(十五):特征工程——PySpark DataFrame数据处理核心指南 📚 一、DataFrame核心概念 1.1 什么是DataFrame?本质:PySpark DataFrame是一个分布式、不可变、基于命名列的数据集合,类似于关系型数据库表或Pandas DataFrame,但底层是RDD的封装。关键特性: 分布式处理:数据自动分区在集群节点上并行处理 惰性 大数据 2025年12月14日 160 点赞 0 评论 6925 浏览
【docker】Docker Image(镜像) 系列文章目录 文章目录 系列文章目录 一、Docker镜像是什么? 镜像生活案例 镜像分层生活案例 为什么需要镜像 二、镜像命令详解 1.镜像命令清单 2.具体命令使用 (1)docker images (2)docker tag (3)docker rmi ( 大数据 2025年12月14日 160 点赞 0 评论 7135 浏览
【JavaWeb学习 | 第18篇】Servlet与MVC 🌈 个人主页: Hygge_Code 🔥 热门专栏:从0开始学习Java | Linux学习| 计算机网络 💫 个人格言: “既然选择了远方,便不顾风雨兼程” 文章目录 深入理解Servlet与MVC JSP内置对象回顾🥝 1. request对象 2. respons 大数据 2025年12月14日 187 点赞 0 评论 18592 浏览
探索大数据领域Spark的分布式计算性能提升方法 Spark分布式计算性能调优全攻略:从原理到实践的12个关键方法副标题:解决Shuffle慢、资源浪费、任务倾斜的实战指南 摘要/引言你有没有遇到过这样的场景? 写好的Spark任务跑到一半卡住,盯着日志看“Shuffle Read”进度半天不动; 明明给了10个Executor,却只有2个在干活, 大数据 2025年12月14日 125 点赞 0 评论 9657 浏览
Java 大视界 -- Java 大数据在智能交通智能停车诱导与车位共享中的应用 Java 大视界 -- Java 大数据在智能交通智能停车诱导与车位共享中的应用 引言: 正文: 一、Java 构建的智能停车全场景技术体系(含极端气候适配) 1.1 寒地设备续航优化(哈尔滨实战) 1.2 设备故障预测模型(全国 19 城数据训练࿰ 大数据 2025年12月14日 64 点赞 0 评论 12392 浏览
时序数据库选型指南:从大数据视角看 Apache IoTDB 的优势 👨🎓博主简介 🏅CSDN博客专家 🏅云计算领域优质创作者 🏅华为云开发者社区专家博主 🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入! 🐋 希望大家多多支持,我们一起进步ÿ 大数据 2025年12月14日 115 点赞 0 评论 14143 浏览
【AI微服务】【Spring AI Alibaba】② Agent 深度实战:构建可记忆、可拦截、可流式的智能体系统 📖目录 前言 1. 什么是 Agent?为什么需要它? 2. Agent 核心能力全景图 3. 核心功能详解(结合 AgentsExample.java) 3.1 基础配置:模型与 Prompt 3.2 工具集成:让 Agent “动手” 3.3 动态 Prompt:上下文 云原生 2025年12月14日 72 点赞 0 评论 10403 浏览