数据结构与算法

【深入浅出Seata原理及实战】「入门基础专题」探索Seata服务的AT模式下的分布式开发实战指南(2)

承接上文 上一篇文章说到了Seata 为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式解决方案。那么接下来我们将要针对于AT模式下进行分布式事务开发的原理进行介绍以及实战。 Seata AT模式 在AT、TCC、SAGA 和 XA 这四种事务模式中使用最多,最方便的就是 AT 模式。与其他事务模式相比,AT 模式可以应对大多数的业务场景,且基本可以做到无业务入侵,

小记Elasticsearch数据迁移

背景 机房需迁移,决定使用阿里云作为临时过渡,因此需要将数据从久的集群迁移到新的机器上。 迁移的方法有很多种,可以使用ES自带的reindex,也可以使用开源工具。我不想装其他东西,所以决定使用reindex。以下为操作记录。 步骤 1.设置白名单 A集群的数据迁移到B集群上,因此需要修改B集群的elasticsearch.yml配置文件,添加以下配置 # reindex.remote.white

where 1=1 是什么意思???

where 1=1 先来看一段代码 <select id="queryBookInfo" parameterType="com.ths.platform.entity.BookInfo" resultType="java.lang.Integer"> select count(id) from t_book t where 1=1 <if test="tit

LSM Tree 数据库底层索引

数据库中非常常用的索引数据结构——B+ 树,在过去很多年里它都是数据库索引的首选实现方式,但是这种数据结构也并不是很完美。因为,每次修改数据都很有可能破坏 B+ 树的约束,我们需要对整棵树进行递归的合并、分裂等调整操作,而不同节点在磁盘上的位置很可能并不是连续的,这就导致我们需要不断地做随机写入的操作,而随机写入的性能是比较差的,这个问题在写多读少的场景下会更加明显。 LSM Tree(Log S

R-论文三线表快速实现-update

经常在报道基线资料时候,会设计表格,需要摘录统计结果,非常麻烦的调整表格。 今天本文章利用compareGroups就解决这样的问题。 今天就来介绍一个简单有效的数据整理成表格的包。直接上效果图 image.png Tableone包 之前介绍过一期利用 Tableone包实现三线表,最终的展现效果很好。但是有些功能不好实现。譬如OR与RR值的展示。具体操作见:R:绘制临床三线表

Linux 操作的良好习惯总结

从事运维,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题。 一、线上操作规范 1. 测试使用 当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一天,老大把root密码交给我,由

观测数据处理-国控环境监测站点

工作需要用到我国环境监测站点的污染物浓度数据(感谢大佬的分享), 数据很全, 不过csv格式在分析的时候尤其大量数据分析的时候并不友好, 所以一般要二次处理一下 上学的时候搞过一次, 当时为了查询数据方便, 塞到了sqlite3的单文件数据库里, 不过制作起来很慢(可能是我没用并行支持好的数据库), 近期更新了一下数据且又重新调整了一下数据处理逻辑, 这里记录一下 主要的思路是以netcdf保存

日拱一卒:GROUP BY 分组

1. 基础 group by 对结果集进行分组,在分组的列上可以使用聚合函数(avg、sum、max、min、count) group by 必须在 where 之后 order by 之前 having 子句可应用限定条件进行分组 group by ... having ... 基本语法 SELECT column_name, function(column_name) FROM tabl

HNSW(Hierarchical Navigable Small World)算法

HNSW(Hierarchical Navigable Small World) 是一种高效的 近似最近邻搜索(Approximate Nearest Neighbor, ANN) 算法,广泛应用于高维空间中的大规模数据检索任务。它的核心思想是通过构建多层图结构来实现快速搜索,同时保持较高的搜索精度。以下是 HNS