大数据

蚂蚁 Flink 实时计算编译任务 Koupleless 架构改造

张冯君(远远) Koupleless PMC 蚂蚁集团技术工程师 就职于蚂蚁集团中间件团队,参与维护与建设蚂蚁 SOFAArk 和 Koupleless 开源项目、内部 SOFAServerless 产品的研发和实践。 本文 3488 字,预计阅读 11 分钟  业务背景 基于开源 Apache

计算机专业的痛只有自己懂:基于Hadoop+Spark的大学生就业数据分析系统成救星

💖💖作者:计算机毕业设计小途 💙💙个人简介:曾长期从事计算机专业培训教学,本人也热爱上课教学,语言擅长Java、微信小程序、Python、Golang、安卓Android等,开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代

Kafka、RabbitMQ、RocketMQ的区别

Kafka、RabbitMQ、和RocketMQ 都是广泛使用的消息中间件,它们各自有不同的特点、架构设计和应用场景。下面是它们之间的主要区别: 1. 架构设计 Kafka: Kafka 是一个分布式流处理平台,最初由 LinkedIn 开发,主要用于处理大规模数据流。 Kafka 的架构包括 Producer(生

详解RabbitMQ工作模式之发布确认模式

​​​​​​​目录发布确认模式概述消息丢失问题发布确认的三种模式实现步骤应用场景代码案例引入依赖常量类单条确认运行代码批量确认运行代码异步确认运行代码对比批量确认和异步确认模式发布确认模式概述 发布确认模式用于确保消息已经被正确地发送到RabbitMQ服务器,并被成功接收和持久化。通过使用发布确认,生产者可以获得对消息的可靠性保证,避免消息丢失。这一机

【Linux】已解决E: Unable to fetch some archives, maybe run apt-get update or try with --fix-missing?

个人简介:某不知名博主,致力于全栈领域的优质博客分享 | 用最优质的内容带来最舒适的阅读体验!文末获取免费IT学习资料!🍅 文末获取更多信息 🍅 👇🏻 精彩专栏推荐订阅收藏 👇🏻 专栏系列 直达链接 相关介绍 书籍分享 点我跳转

国产时序数据库选型指南-从大数据视角看透的价值

摘要:大数据时代时序数据库崛起,工业物联网场景下每秒百万级数据点写入成为常态。Apache IoTDB凭借单节点1000万点/秒的写入性能、毫秒级查询响应和20:1超高压缩比脱颖而出,其树形数据模型完美适配工业设备层级结构。相比传统数据库,IoTDB存储成本降低80%,查询效率提升10倍,已应用于国家电网、中

Hadoop3.1.3分布式集群搭建,从零开始,保姆级教程

目录一、安装VMware二、搭建CentOS7系统2.1配置CentOS7基本项2.2安装CentOS7系统2.3网络配置三、Xshell连接虚拟机四、Hadoop分布式集群搭建4.1将必要文件导入至虚拟机中4.2 JDK1.8安装1.卸载系统自带的JDK2.添加java环境变量4.3克隆虚拟机1.克隆2.修改网络配置文件 3.修改主机名4.在Xshell中添加虚拟机5.禁用防火墙4.4 SSH配

【数据分析】Power BI的使用教程

目录 1 Power BI架构 1.1 Power BI Desktop 1.2 Power BI服务 1.3 Power BI移动版 2 Power Query 2.1 Power Query编辑器 2.2 Power Query的优点 2.3 获取数据 2.4 数据清洗的常用操作 2.4.1 提升标题 2.4.2 更改数据类型 2.4.3 删除错误/空值 2.

深入学习RabbitMQ的Direct Exchange(直连交换机)

        RabbitMQ作为一种高性能的消息中间件,在分布式系统中扮演着重要角色。它提供了多种消息传递模式,其中Direct Exchange(直连交换机)是最基础且常用的一种。本文将深入介绍Direct Exchange的原理、应用场景、配置方法以及实践案例,帮助读者更好地理解和使用这一消息传递模式。 一、Direct