Triad sou.

統計

Satterthwaiteの近似 (2)

前回書いた結果をもとにして、ちゃんと近似できているのか試してみることにしました。 今回は Welch (1938) の (2) 式の統計量 \[ v=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}} \] を導出する過程で出てくる分布の近似を考えてみ…

pivotal quantityと無情報事前分布

[1] の説明が分からなかったので、考えたり調べたりしていたら [2] を見つけることが出来た。 ある尤度関数 $p(y \mid \theta)$ に対して、無情報事前分布を構成する事を考える。 どんなパラメータ $h(\theta)$ に対して一様な事前分布を考えるかによって、$…

Satterthwaiteの近似 (1)

Biometrics Bulletin 1946 [2] を最初に読んだけど、詳しい話が書いてなかったので Psychometrika 1941 [1] を読んだ。概要は、不偏分散の推定量 \[ V_i=\frac{1}{\nu_i}\sum_{j=1}^{n_i}(Y_{ij}-\bar{Y}_i)^2 \] の和の分布および、カイ二乗分布に従う確率…

重み付き最小自乗推定量と、不等分散下の最良線形不偏推定量

線型モデル $\mathbf{Y}=\mathbf{X}\mathbf{\beta}+\boldsymbol{\epsilon}$ において、不等分散下 \[ \mathrm{E}\left(\mathbf{Y}\right)= \mathbf{X}\mathbf{\beta}= \begin{pmatrix} x_{11} & x_{12} & \cdots & x_{1m} \\ x_{21} & x_{22} & \cdots & x_{…

t 統計量の分布

この発想はアートだと思う。 確率変数 $X_1, X_2, \ldots, X_i, \ldots, X_n$ が互いに独立に $\mathrm{N}(\mu, \s^2)$ に従うとき、統計量 \[ T=\frac{\bar{X}-\mu}{\sqrt{\frac{U^2}{n}}} \] は自由度 $n-1$ の $t$ 分布に従う。 ただし、 \[ \bar{X}=\fra…

リサンプリングを用いた多重比較

理論的な説明はとりあえずすっ飛ばして、 今回は、果たしてどういう計算をしているのか、という視点でまとめます。今回使うのは [1] に書かれている有名な方法で、一部では min P とも呼ばれるらしいです。 リサンプリングによって全ての比較が帰無仮説の時 …

Network Algorithm

ネットワークアルゴリズム。 日本語の解説ってあったっけ? 参考文献 [1] Mehta CR, Patel NR. A network algorithm for performing Fisher's Exact Test in r × c contingency tables. Journal of the American Statistical Association 1983; 78(382): 427…

スコア信頼区間

スコア信頼区間の求め方を復習。積二項分布モデルの尤度から、リスク比 $\phi=p_1/p_2$ のスコア信頼区間を求める。 スコア関数と Fisher 情報行列から $\mathbf{S}^t(\phi)\mathbf{I}^{-1}\mathbf{S}(\phi)=z^2$ をみたす $\phi_{L}$ と $\phi_{U}$ を求め…

2×2×k表の共通オッズ比の検定

共通オッズ比の検定の帰無仮説は、層の数を $k$ として第 $i$ 層のオッズ比を $\theta_i$ とすると、 \[ H_0: \psi_1=\psi_2=\ldots=\psi_k=\psi=1 \] \[ H_1: \mbox{not } H_0 \] 以下である。 これは、オッズ比均質性の検定よりは厳しい帰無仮説になってま…

ルベーグ積分

数学セミナー(81年10月号)を古本屋で買いました。 大学でニセ数学しか勉強していなかった私にとっては非常に分かりやすかった。 何で必要になったのかということと、何が出来るようになるのかも厳密にではないが理解できた。 後は確率にどう繋がっていくのか…

オッズ比均質性の検定

共通オッズ比の検定 (test for common odds ratio) は Mantel-Haenszel test を中心に、入門書でも結構詳細に解説してあるものが多いと思う。 Mantel-Haenszel test の原典[1]は30ページ近くあり、かなり読むのが大変。純粋に統計の論文ではなく、後ろ向き研…

ベイズ推定と交換可能性

交換可能性を満たす場合、$n$ 個の確率変数 $X_i$ ($i=1, 2, \ldots, n$) の同時確率 (密度) 関数において \[ p(x_1, x_2, \ldots, x_n)= p(x_{\s(1)}, x_{\s(2)}, \ldots, x_{\s(n)}), \] が成り立つ。 ただし、$\s$ は集合 $\{1, 2, \ldots, n\}$ に対する…

ラプラス近似 (3)

不完全ベータ関数の近似はまとめるほど理解できなかったので、また時間があるときにやろう。 今日はラプラス近似が何をしてるかを少しグラフィカルに検討した。 \[ \int_{\mathbf b\in R^q}\exp\{h(\mathbf b)\}d\mathbf b \simeq \exp\{h(\hat{\mathbf b})\…

不完全ベータ関数の近似 (2)

\[ p(\theta \mid y)=\int_{\theta_1}^{\theta_2}\begin{pmatrix}n \\ y\end{pmatrix}\theta^y(1-\theta)^{n-y}d\theta \] Laplace が使った近似を調べてるんだけど、$\theta^y(1-\theta)^{n-y}$ を $y/n$ の周りで展開して・・・、なんて言う話と、正規分布…

不完全ベータ関数の近似

Bayesian inference 勉強中。 prior distribution を一様分布で尤度が二項分布の時の posterior distribution は \[ p(\theta \mid y)=\frac{\displaystyle \int_{\theta_1}^{\theta_2} \begin{pmatrix}n \\ y\end{pmatrix} \theta^y(1-\theta)^{n-y} \mathr…

ラプラス近似 (2)

090217 の記事で挙げた Asymptotic methods in analysis を読んできた、1st ed. だった。 4.2 A general case, 4.6 Multiple integrals にきれいに書いてあった、前提条件も書いてある。 積分近似自体は Laplace のアイデアだから、The Laplace method for i…

ラプラス近似 (1)

積分のラプラス近似についてです。 だいぶ昔に [1] を引用して非線形混合効果モデルについて書いたことがあったのですが、積み残しを消化 (詳細を理解) するためにラプラス近似について調べてみました。ラプラス近似を見てなんじゃこりゃと思ったのが [1] p.…

ASA

いつの間にかASAから出てる論文がWebでフリーで読めるようになってる(2001年以降のものだけ)。 JASA, The American Statistician辺りはそこそこ読むので取り寄せないで済むから助かる。 後はProject Euclidも外せない。 Annals系は余り読む機会もないが、Ber…

層別解析とサブグループ解析

"Stratified analysis" "Subgroup analysis" で検索してみた。 HIT数が思ったより少ない。 自分はStatified analysisの方は層別解析、調整した解析として使っている。 Subgroup analysisの方は部分集団それぞれに対して通常の解析や層別解析を行うこと、とし…

StatLib

StatLib---Applied Statistics algorithms Applied Statistics(JRSS C)に載ったアルゴリズムのソースがみられる。 ほとんどFortran?

ノンパラメトリック回帰

ノンパラメトリック回帰は面白いなぁ。 SAS の Loess Procedure を使って解析してみたので、ついでに勉強しておきたい。 しかし、大学には教科書が無く、授業で取り扱うことが無かった。 今回は、竹澤邦夫先生のHP [1] を見てなにやらすごいことが分かり、そ…

分散安定化変換

分散安定化変換は、確率変数 $Y$ の期待値が $\mu$ で分散が $g(\mu)$、つまり $Y$ の分散が期待値の関数であるとし、$h(Y)$ の分散 $\mathrm{Var}\{h(Y)\}$ が漸近的に一定の値になるような変換 $h$ を考える方法です。 分散安定化変換 デルタ法を用いると…

HSPH Program on Causal Inference

Harvard School of Public Health PROGRAM ON CAUSAL INFERENCE in Epidemiology and Allied Sciences Harvard School of Public HelthのEpidemiologyとCausal InferenceのHP。 Publicationから、Robins先生の論文がかなり沢山ダウンロードできるようになっ…

傾向スコアと多重共線性

傾向スコアの推定には、全ての交絡因子によってスコアを推定しなければならないという条件がある。 傾向スコアの推定に全ての交絡因子をつっこんだときに、交絡因子間に多重共線性が生じていても問題ないの?と疑問に思った。 私の近くにいる人に質問したと…

要約データを用いた一元配置分散分析

面白そう、論文はいつか読む。 参考文献 [1] Larson DA. Analysis of Variance With Just Summary Statistics as Input. American Statistician 1992; 46: 151–152. [2] SAS Customer Support Center. Sample 524: One-way ANOVA on summary data. http://su…

要約データを用いたt検定

SASの便利機能。 各群の平均、標準偏差、サンプルサイズをデータセットに入れると検定結果が出る。 /* ダミーデータを作る */ data ttest; do group = 1 to 2; do i = 1 to 10; Value = group * 2 + rand('normal'); output; end; end; /* 要約データを用い…