本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

如何让stata 计算出变量的p20 p80 这样的百分位数

stata培训 cdadata 16989℃

如何让stata 计算出变量的p20 p80 这样的百分位数——stata 百分位数

sum varname, detail
或者
tabstat varname, s(p1 p5 p10 p25 p50 p75 p90 p95 p99)
只能在输出结果中得到给定的 百分位数的统计值
如果想计算出某个变量或某些变量的 p15 p20 p80 p85 这样非标准化的百分位数统计值, 该如何操作呢?


解答;

xtile varname2=varname, nq(100)
sort varname2
duplicates list varname2 varname

多谢回复和指教, 我去试试看!
请问: 如下注释正确吗?
实话实说, 虽然我参考帮助文件对您给出的每条命令的含义大体弄明白了, 但是您这几条命令的思路还是没有琢磨出来, 可否请您再给具体解释一下, 多谢啦!

xtile varname2=varname, nq(100) /* 创建名为 varname2 的新变量, 按照百分位数对 名为 varname 的变量进行分类,
nq(100) 选项 表示 百分位数的个数是100个, 即 每1%作为一个分段点.
*/
sort varname2 // 将数据集中的obs 按照 新变量 varname2 进行排序
duplicates list varname2 varname // 列出 变量 varname2 和 变量 varname 中 重复的 obs

 

基本就是你理解的,最后一条命令主要考虑样本数大于100情况下,按百分比从低到高排列样本

_pctile length, nq(10)

转载请注明:数据分析 » 如何让stata 计算出变量的p20 p80 这样的百分位数

喜欢 (7)or分享 (0)