本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

stata如何删除重复值_stata删除重复值

stata培训 cdadata 19032℃

如何在stata中删除重复值

关键词:stata中删除重复值,stata 删除重复数据

请问 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作。

(2)想有条件地删除样本,比如 if year==2007 ,命令是怎样的呢?

我的问题的两个例子就是:
(1) id      year      age        height
1      2007       5             1.2
1      2007        5            1.4
2      2008        5            1.2
比如在这个数据中,前两个样本id  year  age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。

(2)还是上面的数据,然后我想要删掉 year==2007的全部样本。

请问这两个命令如何操作,谢谢了。


最佳解答:

*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N


如果想要删除height较大的数据 需要怎么做呢

*先gsort排序,再duplicates去除第二个相同样本

gsort year -height

duplicates drop id-age, force

转载请注明:数据分析 » stata如何删除重复值_stata删除重复值

喜欢 (7)or分享 (0)