数据结构与算法

拯救你那些富集不到结果的基因

数据整理 因为这个是我学生的真实数据,所以就不方便放出来给大家做示例文件了,可以只看代码,或者拿自己的数据练练手。 library(org.Hs.eg.db) library(clusterProfiler) library(dplyr) library(ggplot2) deg=read.csv("deg.csv",row.names = 1) head(deg) ##

MySql数据库分布式存储配置

一、环境准备: 主机名 角色 IP地址 client50 客户端 192.168.88.50/24 Mycat60 分片服务器 192.168.88.60/24 Mysql63 数据库服务器 192.168.88.63/24 Mysql64 数据库服务器 192.168.88.64/24 Mysql65 数据库服务器 192.168.88.65/24

FST值的数据可视化

一、准备工作; 用excel创建如下图的excel数据,然后保存成CSV格式 image.png 创建工作目录 getwd() 把准备好的文件放在这个工作目录下 一、读入数据; dt1<- read.csv("test.csv",sep=",", header = T) read.csv和read.csv2与read.table相同,但默认值除外。 它们用于读取“逗号分隔

Pandas|筛选包含特定字符的列

问题描述一: dataframe的某一列为字符串格式,想筛选出含有特定字符串的行,如书目数据的“简单分类号”列,筛选包含['N','O','P','Q','S','TB','TM','TN','TP','TS']分类号的数据。 使用模糊匹配,具体实现代码如下: select_list = ['N','O','P','Q','S','TB','TM','TP'] select_list  = '|'

MySQL——并发insert on duplicate key update遇见死锁

前言 数据库死锁问题,是一个老生常谈且很常见的问题,网上也有非常多对于各类死锁场景的解析和复现,但凡和死锁有关,无外乎不涉及数据库隔离等级、索引、以及innodb锁等相关原因。 一、问题的背景: 我们的数据库中的发生死锁的表是具有”多列组合构建的唯一索引“(不包含自增的主键),且数据库的隔离等级为Read Committed,另外对于这个表来说是写入远大于读取的,由于业务的原因,经常会出现同一数据

存储引擎 - InnoDB

存储结构 5.7-引擎架构图 内存结构 内存结构主要包括 Buffer Pool、Change Buffer、Adaptive Hash Index和 Log Buffer 四大组件 Buffer Pool 缓冲池,简称BP。BP以 Page 页为单位,默认大小 16 K。BP的底层采用链表数据结构管理 Page。 在 InnnoDB 访问表记录和索引是会在 Page 页中缓存,以后使

基于MybatisPlus代码生成器(2.0新版本)

一、模块简介 1、功能亮点 实时读取库表结构元数据信息,比如表名、字段名、字段类型、注释等,选中修改后的表,点击一键生成,代码成即可提现出表结构的变化。 单表快速转化restful风格的API接口并对外暴露服务。对于百余张表的数据库,使用代码生成器让开发事半功倍。 多表连接查询。多表连接查询默认不开启,需要在全局文件中手动配置。 开启多表连接查询后,代码生成器会自动读取数据库元数据信息中的主外键关

R语言数据处理替换操作(含gsub函数常用示例)——实战单细胞信息注释函数 2022-07-01

适用背景 在R语言中,我们需要对字符串、向量和数据框等数据类型进行替换操作,有时候是因为需要更换别名,有时候是因为数据存在错误需要修正,有时候则是因为需要删除某些信息。本文将介绍常用的替换函数gsub的常用用法,但gsub也存在某些局限性,一般只能进行一次指定情况的操作。例如在单细胞数据分析的信息注释过程中,我们常常需要把无监督聚类得到的clusters注释成细胞类型,如果每一个clusters都

iTAK:在线预测全基因组转录因子TF,转录调节因子TR与蛋白激酶PK

前言 康奈尔大学,FeiLab的一个预测工具。 iTAK 是依赖于数据库的用于从蛋白质或核苷酸序列中识别植物转录因子 (TF)、转录调节因子 (TR) 和蛋白激酶 (PK),然后将单个 TF、TR 和 PK 分类为不同的基因家族的工具。 本人能力有限,本文可能存在描述不当与错误的地方,请仔细辨别后使用。 鉴定与依据 TFs 和 TRs 的识别和分类是基于主要从 PlnTFDB (Perez-Rod

Java编程技巧:if-else优化实践总结

文/朱季谦 说实话,其实我很讨厌在代码里大量使用if-else,一是因为该类代码执行方式属于面向过程的,二嘛,则是会显得代码过于冗余。这篇笔记,主要记录一些自己在工作实践当中针对if-else的优化心得,将会不定期地长期更新。 一、使用策略枚举来优化if-else 看到网上蛮多人推荐使用策略模式来优化if-else,但我总觉得,搞一堆策略类来优化大批量if-else,虽然想法很好,但无意之中很可能