1.SQL语句中IN包含的值不应过多:
例如:select id from t where num in(1,2,3) 对于连续的数值,能用between就不要用in了; 实测速度差距不是很大.
image.png
2.SELECT语句务必指明字段名称:
禁止用 * 来查询 ,禁止用 * 来查询 ,禁止用 * 来查询 , 查找哪个字段,就写具体的字段.
select * from
R for Data Science
tidy流处理数据的方便,我想这与管道符%>% 的使用,数据处理动词化,有着很重要的关系。
这是之前做数据清洗时,用到比较重要的一些技能和方法。
R for Data Science(笔记) ---数据变换(filter使用)
R for Data Science(笔记) ---数据变换(select基础使用)
R for Data Sci
1:为什么merge的时候,明明一个数据集是每人一条,然后另一个数据集是一人多条的时候,通过usubjid连接的时候,还是只有一个人只有一条记录。
也就是说我现在要将RFPENDTC merge 到其他数据集的时候,即使这个数据集是一人一条,但是最终输出的也只是一个人只有一个RFPENDTC的记录,而不是这个人的每条观测都有RFPENDTC.
就比如说
data dm;
set sd