如何在stata中删除重复值
关键词:stata中删除重复值,stata 删除重复数据
请问 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作。
(2)想有条件地删除样本,比如 if year==2007 ,命令是怎样的呢?
我的问题的两个例子就是:
(1) id year age height
1 2007 5 1.2
1 2007 5 1.4
2 2008 5 1.2
比如在这个数据中,前两个样本id year age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。
(2)还是上面的数据,然后我想要删掉 year==2007的全部样本。
请问这两个命令如何操作,谢谢了。
最佳解答:
*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N
如果想要删除height较大的数据 需要怎么做呢
*先gsort排序,再duplicates去除第二个相同样本
gsort year -height
duplicates drop id-age, force
转载请注明:数据分析 » stata如何删除重复值_stata删除重复值