stata如何删除重复值_stata删除重复值-数据分析

如何在stata中删除重复值

关键词：stata中删除重复值,stata 删除重复数据

请问（1）在stata中有某两个或多个样本所有变量或部分变量相同，想删除重复的样本仅保留一个如何操作。

（2）想有条件地删除样本，比如 if year==2007 ，命令是怎样的呢？

我的问题的两个例子就是：
（1） id    year    age       height
1    2007    5          1.2
1    2007       5          1.4
2    2008       5          1.2
比如在这个数据中，前两个样本id  year  age相同，我想要删除掉其中一个，仅保留一个，然后还想附加一个条件，就是删掉height较小（1.2）的那个。

（2）还是上面的数据，然后我想要删掉 year==2007的全部样本。

请问这两个命令如何操作，谢谢了。

最佳解答：

*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N