数据结构与算法
分享6个Pandas数据处理代码
今天和大家分享自己总结的6个常用的Pandas数据处理代码,对于经常处理数据的coder最好熟练掌握。
选取有空值的行
在观察数据结构时,该方法可以快速定位存在缺失值的行。
df = pd.DataFrame({'A': [0, 1, 2],
'B': [0, 1, None],
'C': [0, None, 2]})
d
547. 【数据库】数据库常见分类标准
一、按存储的数据模型分类
根据数据所管理的数据模型,可以分为结构化关系型数据库(RDBMS、SQL、NewSQL)、半结构化非关系型数据库(NOSQL)、非结构化非关系型数据库(NOSQL)、混合格式多模数据库(Multi-model)。
下面主要解释下这几类数据模型:
结构化数据:结构化数据特指由二维表结构来逻辑表达和实现的数据。
半结构化数据:半结构化数据是一种自描述结构,如 JSON、XM
Spring Boot多数据源切换查询
今天遇到一个场景,公司的消息因为过多。所以做成了分库的情况。一个月内的数据存在当前表中。一个月之前的数据存放在备份表中。然后把主库和备份库做成多数据源的形式。在查询的时候如果主库表中没有就去备份库中查询。
其实说起来好像挺高端的。但是实现上很简单,下面是具体的实现。
数据源配置
导包,基本项目架构啥的我就不多说了。直接上配置文件。我这里是用yml的形式:
spring:
datasource:
Pandas 依据特定列去除重复值
目的:依据特定的几个列,对数值相同的行进行删除
函数:pandas.DataFrame.drop_duplicates()
功能:针对输入的DataFrame格式的数据,去除指定列下面的重复的行,返回一个DataFrame数据
参数解释:
subset:默认采用所有列,可以指定特定列
keep:可选{‘first’, ‘last’, False}, 默认 ‘first’,选择保留第一次还是最后
MySql数据库·表管理
一、表的定义:
表是存储数据的文件
创建表之后会在/var/lib/mysql/库目录下生成表名.frm和表名.ibd二个文件,前者存的是表头信息,后者存的是数据记录
二、语法格式:
创建表:
CREATE TABLE 库名.表名(
表头名1 数据类型,
表头名2 数据类型,
...
);
查看表头:
DESC 库名.表名;
删除表:
DROP TABLE 库名.表名;
修改表:
ALT
百战尚学堂java知识点
XML是eXtensible Markup Language(可扩展标记语言)的英文缩写。标记(Markup)通常是指一个文档中不需要实际打印输出的部分,主要用于告知文档编辑者(人或软件系统)文档格式的描述,即可以按照“标记”给出的“注解”进行文档格式的相应编排。广泛使用的HTML(Hyper Text Markup Language)就是网页文档格式的标记化语言。XML现已经成为互联网上数据表示
MySql分片规则·求模分片
一、求模分片规则(mod-long)
表中必须有名叫id的表头
根据id表头与设定数字取余的结果存储数据
余数是 0 数据存储到 dn1
余数是 1 数据存储到 dn2
余数是 2 数据存储到 dn3
二、相关配置
schema.xml文件中设置mod-long规则
# 查看使用mod-long分片规则的表名:
[root@maxscale56 ~]# vim /usr/loc
数据库多表查询 联合查询 增删改查
1|*1*****方式一
语法:
insert into 表名 (字段名,...) values (值,...);
特点:
1、要求值的类型和字段的类型要一致或兼容
2、字段的个数和顺序不一定与原始表中的字段个数和顺序一致
但必须保证值和字段一一对应
3、假如表中有可以为null的字段,注意可以通过以下两种方式插入null值
①字段和值都省略
②字段写上,值使用null
4、字段和
429. 【数据库技术基础】数据库与数据库系统
数据是描述事物的符号记录,它具有多种表现形式,可以是文字、图形、图像、声音和语言等。
信息是现实世界事物的存在方式或状态的反映。信息具有可感知、可存储、可加工、可传递和可再生等自然属性,信息已是社会各行各业不可缺少的资源,这也是信息的社会属性。
数据是信息的符号表示,而信息是具有特定释义和意义的数据。
数据库系统(DataBase System, DBS)是一个采用了数据库技术,有组织地、动态地存