Triad sou.

2010-01-01から1年間の記事一覧

バッチファイル 実行ディレクトリ名の取得 (2)

PC

なんか悔しかったので、ループを使わない方法を考えてみた。 @echo off call set CPATH=%CD% cd ../ call set UPATH=%CD% call set CDN=%%CPATH:%UPATH%=%% call set CDN=%CDN:~1% cd %CPATH% echo %CDN% PAUSE ルートディレクトリだった場合とかは考えてい…

ggplot2 の自分用メモ集を作ろう

プロットの作製 基本プロットを作る Geoms Aesthetics 違う種類のグラフを重ねる 参照線の追加 グループ分け 層別プロット スケールと軸 Scales 軸ラベルやタイトルの変更 軸の表示範囲を変更する 軸の左右の余白を削除する 軸表示の修飾 日時の軸スケール …

ggplot2 の自分用メモ集を作ろう (古い内容)

古い記事を移動しました。 基本プロットを作る 基本的な手順は、 ggplot() にデータフレームと各軸や層に対応する変数名を指定する 書きたいグラフに対応する geom_XXX() を足す の二つが分かっていれば OK です。 これに加えて、統計処理をしてくれる stat_…

SAS 9.2 でファイルタイプの関連付けを再設定する方法

SAS

Usage Note 32464: Registering file types via the SAS Filetype Registration Utility for SAS 9.2 Phase 1 and SAS Enterprise Guide を使う。 上の記事内の [1. Navigate to Index of /techsup/download/pc.] のリンクからユーティリティーをダウンロー…

gdipp と MS Word

PC

gdipp ってなに 最近話題なので入れてみました。 gdipp - Project Hosting on Google Code 窓の杜 - インストールするだけであらゆるソフトのテキストを美しく滑らかに描画「gdipp」 gdipp_x86_0.7.6.msi を program loader でインストール。 MS Wordだと こ…

DDE を使って Excel シートの指定範囲を初期化する SAS マクロ

SAS

%macro DELSHEET(rc); %local vlen nlen k var; data _null_; rc = "&rc."; s = find(rc, "R"); e = find(rc, "C"); r1 = substr(rc, s+1, e-s-1); s = e; e = find(rc, ":"); c1 = substr(rc, s+1, e-s-1); rc = substr(rc, e+1, length(rc)-e); s = find(r…

Google の左メニューを消してくれるFirefox Add-on

PC

Hide/Show Google left-hand menu 1.0.4 右なら良かったのにねぇ。 ↓ 慣れてきた。 旧検索にも戻せるらしい。 http://www.google.co.jp/webhp?hl=all 消えちゃった?

Statistical Methods in Cancer Research がダウンロードできるとは・・・

IARC Publications - PDFs online 個人で非商用の研究に利用する場合は OK だそうです。 Volume I はペーパーバック版を持っています。内容は最新のものではないですが、case-control study に関連した統計手法について、恐ろしいほど多彩な情報を網羅してい…

再帰による組み合わせ列の生成; {0, 1} の場合

R

[1] の文献をかなり参考にさせていただきました。 少し修正して、配列を演算に使えるようにしています。 でも、かなり小標本じゃないと使えないですよねぇ。 shuffer <- function(n, m) { m <- as.integer(m) n <- as.integer(n) if (m > n) { tmp <- m; m <…

clogit() 関数の注意点

R

R の survival package には、条件付きロジスティック回帰分析を行うための clogit() 関数なるものがあります。 最近この関数を使っていて、ちょっと気づいた点がありましたので、メモを残しておこうと思います。 method="approximate" は危ない clogit() 関…

ggplot2 package でカラーパターンの変更

scale_colour_manual を使う事で、ggplot2 で用いられる色のパターンを自分で設定出来るらしいです。 library(ggplot2) colours <- c("#D92121", "#9999FF", "#D92121", "#21D921", "#FFFF4D", "#FF9326") d <- data.frame( ID = floor(seq(1, 6 + 7/8, by =…

R で bootstrap method を実装してみよう

R

高速 tapply(X, INDEX, var) もどき関数 を作ったときに、簡単な実装を考えていたのでまとめてみます。 xxx.test <- function(d, g) { n <- as.numeric(table(g)) index <- as.numeric(factor(g)) mindex <- NULL for(i in 1:length(unique(index))) { minde…

t 分布の分布関数の導出

自由度 $\gamma$ の $t$ 分布の確率密度関数は、 \[ f(T=t\mid \gamma)= \frac{1}{\sqrt{\gamma}B\left(\frac{1}{2}, \frac{\gamma}{2}\right)}\left(1+\frac{t^2}{\gamma}\right)^{-\frac{1+\gamma}{2}} \] である。 ただし、$B(a, b)=\Gamma(a)\Gamma(b)/\…

ヘルプファイル形式の変更

R

R 2.10.x にも大分慣れましたが、ヘルプファイルの形式が text (R 画面内に出てくるやつ) だったので、 html に切り替えました。 よく忘れてしまうので、またメモ。 options(help_type="html") これを、".Rprofile" にでも入れておけばいいみたいです。 ".Rp…

久々に聞いた

Subversion Featuring Ely* - Alright

Wilcoxon の符号付き順位検定と符号検定

SAS

なに procedure だっけ、と思って調べたのでメモ。 data d1; input x1 x2 @@; diff = x1 - x2; cards; 10 12 20 21 30 21 15 18 10 22 ; proc univariate data = d1; var diff; output out = t1 t=t probt=probt msign = msign probm = probm signrank = sig…

指数型分布族

$n$ 個の独立な確率変数 $\mathbf{Y}$ が、$p$ 個のパラメータ $\boldsymbol{\theta}$ を持つ指数型分布に従うとすると、$\mathbf{Y}$ の確率密度関数は、 \[ \begin{align*} f(\mathbf{Y}=\mathbf{y} \mid \boldsymbol{\theta}) &= \left\{\prod_{i=1}^n f(…

一般化線型モデルと乱数

ちょっとだけ勉強したのでメモしておこう。 一般化線型モデル まず、確率変数ベクトル $\mathbf{Y}$ の期待値ベクトルを \[ \boldsymbol\theta=\mathrm{E}(\mathbf Y) \] と書いておきます。 一般化線型モデルと呼ばれている統計モデルでは、 \[ g(\boldsymb…

SAS Excel一括変換するマクロ (2)

SAS

SAS Excel一括変換するマクロ に書いたものを改良したものです。 最近は R ばかり使っていたので、作ったのを忘れていました (2007/07/02に作った物を多少弄ってあります)。 Macro Name: SAS to Excel (xls / csv) batch conversion macro Author: Triad Sou…

ggplot2 package で Kaplan-Meier plot + フォントファミリーを変更する方法

ggplot2 は非常に良いパッケージですね、R をグラフィックスで推すときに、説得力のある実例になるんじゃないかと思いました。 Kaplan-Meier plot の実装例がない様なので、自作してみました。 かなり整理されていなくて申し訳ないのですが、 library(ggplot…

geometry package のアップデートで不具合

久々に W32TeX をアップデートしてみたら Undefined control sequence... ! Undefined control sequence. \Gm@rmargin ->\Geom@rmargin l.52 ...ext margin left=1em,text margin right=1em} ? ! Emergency stop. \Gm@rmargin ->\Geom@rmargin l.52 ...ext m…

最近買った本

服部 哲弥. 統計と確率の基礎. 学術図書出版社, 2006 2ch で服部先生のルベーグ積分の問題と回答集がいいって紹介されていたので、「統計と確率の基礎」も分かりやすいかなと思って買ってみました。 理学部向けっぽい感じがするので、数式を読むのが苦じゃな…

行列を用いない残差分散の不偏性の証明 (重み付き最小二乗法)

重み付き最小二乗法において、残差分散 \[ V_{e}= \frac{\sum_{i=1}^nw_i(Y_i-\hat{Y}_i)^2}{\phi_e},~ \phi_e=n-p \] が $\s^2$ の不偏推定量である事、すなわち \[ \mathrm{E}\left(\sum_{i=1}^n w_i e_i^2\right)=(n-p)\s^2 \] が成り立つ事を示したい。 …

Firefoxメモ

PC

アドオン FireGestures (マウスジェスチャ) NoScript (Javaスクリプト, Javaなどをブロック) Adblock Plus (広告抹消) Drag Drop Upload (そのまんま) Conquery (文字列選択して右クリ→カスタムサーチ、xml を直接編集すると任意のサーチエンジンを登録でき…

R の高速化

R

RjpWiki (REvolutionR は連邦の新型か) を読んでちょっと触ってみました。 環境は、CPU: Core 2 Duo E8400 (3.0 GHz), Memory: 3.3 GB, Windows XP 32bit SP3。 R-benchmark-25.R を5回ずつ実行してみた。 R-org: R-2.10.0 デフォルト ATLAS: ATLAS (C2D, CR…

よく使うパッケージをローカルから一括インストール

R

パッケージ情報が定義してあるPACKAGESファイルと、必要なパッケージファイルを同じディレクトリに配置しておきます。 上のファイル群は、同じタイミングでダウンロードしておかないと、バージョンがずれて失敗するので最悪手で修正します。 Rってパッケージ…

平均値の折れ線グラフにヒゲを付ける

R

あまり好きなグラフではないのですが、axis 関数を使って各時点のサンプルサイズを付加する事ができるようなので、やってみました。 Rには gplots::plotmeans と Rcmdr::plotMeans という関数がありますが、一部のグラフオプションが使えなかったりするので…

Monte Carlo Error

新年初投稿、ちょっと調べ物をしたのでメモ。確率変数 $X$ の期待値 $\theta=\mathrm{E}(X)$ について、モンテカルロ法による近似を考える。 何らかの方法で、$X$ と同じ確率分布に従う $n$ 個の独立な乱数列 $X_i$ ($i=1, 2, \ldots, i, \ldots, n$) が得ら…

Monte Carlo methods & quasi-Monte Carlo methods 系書籍

Lemieux C. Monte Carlo and Quasi-Monte Carlo Sampling (Springer Series in Statistics). Springer, 2009. とりあえずこれを読みました。 Chapter 4 の Variance reduction techniques がまとまっていて読みやすかったです。 quasi-Monte Carlo methods …

2010年の話題

やろうと思っていること 研究 線型モデル (大分すすんだ) 特殊なパラメータ変換をしたときの conditional exact test (積多項分布モデル) リサンプリング・ブートストラップを使った方法 ベイズ流の解析方法、MCMC EMアルゴリズム ネットワークアルゴリズム …