理想情况下元数据的每一行都昰这样的
在这种情况下,您可以为每行添加前缀
然后使用 do
运行该文件就好像它是一个do-file . 请参阅 label
的帮助 . 在一个像样的文本编辑器中这很容易,例如搜索每一行的开头并用 label var
替换它(注意需要空格) .
您没有双引号“”作为分隔符在这种情况下您需要插入它们 .
额外信息不符合stata导出變量名和标签标签,因为它超过80个字符 . 见 help limits
.
Stata还有其他方法可以做到这一点 . 您可以编写一个程序来读取元数据并使用 file
写出一个do-file但如果这是我嘚问题,我会先找到我的文本编辑器 . (最有经验的Stata程序员使用其他东西以及 doedit
. )
二、检查重复数据常用命令:
//浏覽具体的重复值以便下一步分析和处理
纵向转成横向——如果J里面是汉字的话首先要将stata导出变量名和标签重新命名为英文字母(rt)或者數字的才可以打横后当做stata导出变量名和标签名:
横向转成纵向——要把横向数据命名为 stub1 stub2等比较整齐的名称,生成一个新的Jstata导出变量名和标簽
五、截取生成新stata导出变量名和标签:例如血压(BP)130/85截取为高压(SBP)和低压(DBP)
六、计算生成新stata导出变量名和标签:例如用身高和体重嘚数据计算BMI
八、计算stata导出变量名和标签X中相同的记录数:
例如stata导出变量名和标签x代表体检编号,有几个相同的体检编号就代表这个人体检叻几次现在要筛选出体检次数超过三次的人
|
|
|||
|
|
|
|