数据结构与算法

机器学习-聚类分析算法

一、聚类分析的定义聚类分析是一种无监督学习的统计分析方法。它的主要目的是将一个数据集中的样本(或观测值)按照某种相似性或距离度量划分成若干个类别(簇)。在聚类过程中,同一个簇内的样本具有较高的相似性,而不同簇之间的样本相似性较低。例如,在市场细分中,企业可以利用聚类分析将消费者划分为不同

mysql之日志系统:SQL更新语句逻辑

mysql的2个重要日志:物理日志redo log和逻辑日志 binlog。 redo log: 保证crash-safe能力 每次事务的redo log持久化到磁盘:innodb_flush_log_at_trx_commit=1 每次事务的binlog 持久化到磁盘:sync_binlog=1 1、redo log WAL技术:Write-Ahead Logging,关键点是先写日志,在写磁

存储引擎 - InnoDB

存储结构 5.7-引擎架构图 内存结构 内存结构主要包括 Buffer Pool、Change Buffer、Adaptive Hash Index和 Log Buffer 四大组件 Buffer Pool 缓冲池,简称BP。BP以 Page 页为单位,默认大小 16 K。BP的底层采用链表数据结构管理 Page。 在 InnnoDB 访问表记录和索引是会在 Page 页中缓存,以后使

【初阶数据结构】森林里的树影 “堆” 光:堆

文章目录 1.堆的概念及结构 2.堆的接口实现 2.1 堆的初始化 2.2 堆的销毁 2.3 堆的交换 2.4 堆的向上调整 2.5 堆的插入 2.6 堆的向下调整 2.7 堆的删除 2.8 堆顶获取 2.9 堆的判空 2.10 堆的节点个数 2.11 堆的打印 2.12 堆的排序(向上建堆) 2.13 堆的排序(向下建堆)

Django 数据库连接丢失

在 Django 工程中,有时候我们需要在服务器上执行一些脚本。这些脚本需要 Django 的运行环境,还需要做一些 ORM 操作。一般大概流程如下: import os os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'project.settings') import django django.setup() from app.t

mysql查询成本比较

1.工具 1.mysql:8.0.25 2.msyqlworkbench 2.成本定义 执行sql查询所需要花费的代价 3.查看成本的方式 执行一条示例语句,如下: select sql_no_cache suser.id,suser.name ,srole.name from sys_user suser inner join sys_user_role surole on suser.i

Linux 操作的良好习惯总结

从事运维,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题。 一、线上操作规范 1. 测试使用 当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一天,老大把root密码交给我,由

事务版本控制

问题由来 近段时间我们项目需要实现一个事务版本控制的列式数据库,下面来讲一讲我们的设计: 开启事务时候进行一个事务说明 例如 1.开启事务 POST { "explainValue(操作解释)": "I want update some Info")(必要) } 2.关闭事务 POST 记录