社会ノマド

備忘録と書きもの練習帳。とくに何らかのハンドリング系と、雑多な話題に関する読書録になるかなと思います。

Stataデータハンドリング (ラベリング編)

Stataでのデータハンドリングの際、ラベルなど貼り付けずそのままデータをいじっていたのだがいかんせん読みにくい。今回はラベリングの処理について残しておく。

1.ラベルをつける

変数と値へのラベルを貼り付ける^1

変数名へのラベリング

label variable 変数名 "つけたいラベル"

値へのラベリング

* ラベルを定義
label define ラベル名 1"できる" 2"ある程度できる" 3"あまりできない" 4"できない" 9"無回答"

* ラベルを貼り付ける
label values 変数 ラベル名

* 同じラベルを複数の変数に貼り付けたいとき
label values 変数1 変数2 変数3 ラベル名

2.値を見る

回帰などの分析の際、ラベルではなく値を知りたい場合がある。以下では2つの方法を紹介する。

  1. tabulate コマンドで数値を出力する方法

    tabulate 変数,nolabel と nolabel オプションをつける。表におけるラベルの表示が外れる。

  2. ラベルの定義を確認する方法

    label list ラベル名 で値とラベルの対応表が吐かれる。なお、ラベル名を指定しなければ全てのラベルが吐かれる。

註1.ラベルを貼り付けられないトラブル

ラベルを貼り付ける際、トラブル発生。

may not label strings
r(181);

データの読み込みかエンコードなどが悪かったのだろうか。値ではなく string(文字) と認識されているようなので、stringからnumericへ変換したら解決です。

stringをnumericへ変換

destring 変数, replace