社会ノマド

備忘録と書きもの練習帳。とくに何らかのハンドリング系と、雑多な話題に関する読書録になるかなと思います。

Stata で回帰表の記述統計 (そしてTex)

サンプルをそろえて記述統計 Stataで回帰をした後に記述統計を出したいが,サンプルが揃わない問題がある. 大きくは2つの問題 1. サンプルが揃わない(if で条件付けて解決) 2. カテゴリー変数のレファレンスグループが表示されない * 1も2も解決されず su…

.savをRで取り込む際のトラップ(mac)

R

SPSSを持っていないので.savファイルは開けない…。Rで.savを開く方法はあって以下のコードで読める。ちなみに筆者はMacです。 d <- read.spss("/Users/hogehoge/hoge.sav",to.data.frame =T) 問題点①SPSSに貼られたラベルで読み込んでいる 問題点②文字がきち…

Rの邪魔者<NA>

R

Rでcsvから取り込んだ際,NAではなくて <NA>が入っている時がある。ナニコレ?!結論から言って factor型の空白(="") のよう。is.na()とかis.nan()にも引っかからないし悪戦苦闘…。 そんなときはcsvで読み込む際に以下のようなオプションを付けることが吉。汚いデ</na>…

python: 変数の値を名前にして保存(変数評価)

変数の名前を保存する際の名前にしたい。 import pandas as pd savename = 'むにゃたん' df = pd.DataFrame( {'name': ['一郎','二郎','三郎'], 'educ': ['大','大','高'], 'income': [1000,2000,500]}) このようなデータセットと変数があったとき、むにゃた…

プレビューでpdfをまともに圧縮する

pdfがでかすぎるからプレビューで圧縮しよう。 【OSX】PDF のファイルサイズをプレビュー.app で小さくする 上記でQuartzのパラメタを設定できるらしい。そこでhogeと名付けて設定したのだが、 名前を付けて保存のところに表示されない… どうやら以下が原因…

python における import の使い方

pythonで単純なコード実行はわかってきた。関数定義もひとまずok。でも いちいち対話型に入れるのめんどい!! そこでモジュールをうまくimportをしてpythonと対話せずに読み込む方法をみる。つまるところ簡単な import のしくみ。 まずは import してみる …

オブジェクトの名前を関数内で使いたい

R

問題点 ohayouって名前のオブジェクト名がついたデータフレームがあった時、ohayou.csvにして保存する関数が欲しい場合の解決策。問題は、関数名に渡したohayouを引数内で名前に使おうと思っても使えない。つまり オブジェクト名にアクセスできない 。 解決…

ホテル街を見つける(2)RとGoogleAPIでジオコーディング

R

前回に続いて、ホテル街を見つける技術編第二弾。前回は住所一覧のベクトルをcsvファイルにしまうところまでやりました。 zawazawalong.hatenablog.com 今回は住所一覧を元に緯度経度をゲットする ジオコーディング のやり方について。方法としてはRからGoog…

人口・駅データをプロット

目的はQGISを使って地図上に人口および駅をプロットすること。いろいろな分析の基礎になりますからやっておいて損はなさそうですね。QGISはインストール済みを想定しています。 QGISはレイヤを重ねていくことで表示するので順番に3つを重ねていきます。 日本…

QGISでとにかく表示してみる

なんは無くとも動かしたい!!ということで、QGISはインストールされていることを前提に、以下を参照して表示までの手順。 QGIS初級編 さわってみようQGIS データのダウンロード まず、国土地理院から以下のデータをダウンロード。 「第1.1版ラスタ(2006年…

過去50ツイート時間をリプで返す

リプライで「おい」と飛んできたら、飛ばしてきたアカウントの過去50ツイートのツイート時間を返すbotの作成。下記の機能をtwitterに実装したものです。 Twitter Gem を使って、気になるあの人の生活リズムを覗き見たい…! #loupestudy こんな感じを目指しま…

bot を heroku で動かす

Rubyでbot を作ったはいいが crontab は PC が起きてないと動かない。そこでサーバー上で bot を動かすことを試みる。 Herokuを使って1日1回名言をツイートする Twitter Bot の作り方 上記を参照して同じフォルダに5つのファイルを準備し、ターミナルにて以…

Stataでシークエンス分析

Sequence Analysis のやり方を日本語で紹介したものがみあたらないので、Stataのパッケージマニュアルを参考に、紹介してみる。 Sequence Analysisとは? Seaquence Analysisとは、並び順のパターンを発見する分析である。つまり、 11111 11311 11122 77777 …

doファイル実行で文字化け

Stata14では日本語問題がだいぶ解決されたようだが、13を使っているためStataはどうにも日本語に弱い。以下のように .do ファイルを実行したら日本語が文字化け。ラベリングなどが台無しになったので対策。 do /Users/なんとかかんとか/hirakitaifile.do こ…

Stataデータハンドリング (ラベリング編)

Stataでのデータハンドリングの際、ラベルなど貼り付けずそのままデータをいじっていたのだがいかんせん読みにくい。今回はラベリングの処理について残しておく。 1.ラベルをつける 変数と値へのラベルを貼り付ける^1。 変数名へのラベリング label variabl…

pythonでツイート取得

わかりやすいページが多いけれど練習と覚書きとして。python を用いて、ツイッターへアクセスしツイートを取得、テキストファイル(text.txt)に保存する。今後テキストを元に解析を行ってみる予定。 もくじ API認証 python-twitter を用いてテキストの取得 1 …