Apache Doris 系列: 入门篇-数据导入及查询 数据导入及查询 本文档主要介绍 Doris 的数据导入及数据查询。 数据导入方式 Doris 为了满足不同业务场景的数据接入需求,提供不丰富的数据导入方式,去支持不同的数据源:外部存储(HDFS,对象存储)、本地文件、消息队列(Kafka)及其他外部业务系统数据库(MySQL、Oracle、SQLServer、PostgreSQL等),支持同步和异步的方式将数据接入到 Doris 中。 Doris 数据结构与算法 2025年05月28日 115 点赞 0 评论 19998 浏览
MySQL调优——数据类型和schema优化 范式的作用:解决数据冗余。 反范式:让数据冗余。 实际情况看业务需求 推荐使用代理主键:提高可维护性 建议把数据库的字符集设置成:utf8mb4,因为该字符集只能匹配两个字符长度的中文,而实际还有3个长度的中文。比如“中”用3个字符集来保存的。所以要用utf8mb4来存储。 对于建表时的主键选择: 代理主键:与业务无关的主键如:id,无意义的数字序列 自然主键:事物属性中的自然唯一标识。和我们的业 数据结构与算法 2025年04月18日 106 点赞 0 评论 20011 浏览
【mongoDB】mongoDB查看可回收空间 在mongoDB中删除数据并不会直接释放磁盘,而是产生很多碎片。 这些碎片会被mongoDB继续利用。当有新数据插入时,会重复利用这些碎片,而不需要新申请磁盘空间。 这会导致的问题是,磁盘可能一直处于高水位的使用水平,对运维来说是一个定时炸弹。 因为碎片只会被所属的库使用,但我们经常会新建很多库,这就导致磁盘越来越紧张。 登录mongos $ mongo --host xx.xx.xx.x 数据结构与算法 2025年06月03日 80 点赞 0 评论 20014 浏览
HNSW(Hierarchical Navigable Small World)算法 HNSW(Hierarchical Navigable Small World) 是一种高效的 近似最近邻搜索(Approximate Nearest Neighbor, ANN) 算法,广泛应用于高维空间中的大规模数据检索任务。它的核心思想是通过构建多层图结构来实现快速搜索,同时保持较高的搜索精度。以下是 HNS 数据结构与算法 2025年06月10日 180 点赞 0 评论 20068 浏览
SpringBoot整合ElasticSearch 原文链接 ElasticSearch是个开源分布式搜索引擎,提供搜集、分析、存储数据三大功能。它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等。主要负责将日志索引并存储起来,方便业务方检索查询。 ElasticSearch安装方式参考: Linux安装ElasticSearch Linux安装elasticsearch-head W 数据结构与算法 2025年05月06日 180 点赞 0 评论 20119 浏览
MySQL知识点 1.SQL语言在功能上主要非为如下三类: DDL(Data Definition Languages,数据定义语言),这些语句定义了不同的数据库,表,视图,索引等数据库对象,还可以用来创建,删除,修改数据库和数据表的结构 主要的语句关键字包括CREATE,DROP,ALTER等 DML(Data Manipulation Language,数据操作语言),用于添加,删除,更新和查询数据库记录,并检 数据结构与算法 2024年11月02日 42 点赞 0 评论 20528 浏览