SASデータセットとは?
ID | AGE | WEIGHT |
1 | 18 | 65 |
2 | 25 | 72 |
このデータファイルをデータセットと呼びます。
ID,AGE,WEIGHTなどの項目を変数と呼びます。
行をオブザベーションと呼びます。
データセットと変数に名前をつけるときのルール
・半角で32文字以内。
・先頭は「A~Z」「_」のいずれか
以降は「A~Z」「_」「0~9」のいずれかを指定可能例:
・OK …「ABC」「A123」「_ABCD」
・NG …「12345」・大文字・小文字の区別なし
例えば「WEIGHT」「Weight」「weight」はすべて同じ変数と見なされる。・SASはキャメル式
キャメルケースは「HogeData」 →OK
スネークケースは「hoge_data」 →NG
・「_~_」というデータセットや変数名はNG。予約語(使い道が前もって決まってる単語)を変数名などに使わない。
ワンポイントアドバイス
予約語は大文字に!
例:
PROC SORT DATA=hoge;
BY id;
RUN;