Triad sou.

統計

survivalパッケージのtt関数

はじめに ちょっと色々とやっていて R の survival パッケージの tt 関数の挙動が気になるという話になりました。 survival パッケージでは時間変動共変量の解析が実施可能であり、時間変動共変量と時間変動効果(回帰係数)についての vignette には詳細な…

『宇宙怪人しまりす統計よりも重要なことを学ぶ』を読みました

楽しく読ませていただきました。【新刊案内】『宇宙怪人しまりす統計よりも重要なことを学ぶ』2024/2/26発売あの宇宙怪人が帰ってきた!医療統計を学んできたしまりすに,統計よりも重要なことはあるのか。https://t.co/fnqbMEdpRn— 朝倉書店 (@AsakuraPub) …

割合の差のスコア検定

割合の差のスコア検定 以下のツイートをしましたところ、情報提供をいただきましたので、まとめた文章を作成しました。リスク差の検定の方の式を見るとWald型の統計量で、カイ二乗検定(これはスコア型の検定に一致する)と違うものになっているので、同じに…

GEEの注意点の論文(Pepe & Anderson, 1994)を読んだ話

Pepe & Anderson (1994) 先日雑談をしていて、GEEで時間依存性共変量を使うときに注意が必要という話題になり、この論文を思い出して改めて読みなおしてみようかなと思った次第です。 A Key Condition 細かい話は論文を確認すれば良いとして、この論文で書か…

クロスオーバーデザインにおける順序カテゴリデータの解析 (Senn, 1993)

Senn (1993) クロスオーバーデザインで順序カテゴリアウトカムを用いた場合の解析方法を知らなかったので、このレターを読んでみて、メモを作成しました。 このレターは、Ezzet & Whitehead (1991, Stat Med) に対してコメントをしたもので、Ezzet & Whitehe…

1:1マッチングの場合の2×2×K表の共通オッズ比の無条件の最尤推定量

$K$層の積二項分布モデルの無条件の尤度関数から導かれるスコア方程式 $k$番目の層のCase群の曝露ありの人数が二項分布$X_{11k} \sim Bin(n_{1+k}, p_{1k})$に従い、$k$番目の層のControl群の曝露ありの人数が二項分布$X_{01k} \sim Bin(n_{0+k}, p_{0k})$に…

Bland-Altman分析とlimits of agreementと思い出

はじめに Bland-Altman分析は、臨床検査等について2つの方法の間の一致を評価するための統計的手法です。 Martin Bland先生とDouglas Altman先生が提案し、Lancetに載った論文は5万回以上引用されています(2022/2/1 Google Scholar)。 当時は2つの方法の一…

ある仮定のもとでのKaplan–Meier推定量の正確な分布について

はじめに この記事はあまり実用的ではないです。 調べた内容を忘れてしまうともったいないような気がしたので、一応メモしておくことにしました。生存関数のKaplan–Meier推定量$\hat{S}(t)$は非常によく使われていて、$\sqrt{n}\{\hat{S}(t)-S(t)\} \to^d -S…

部分集団と集団全体での割合の差に対する推測

以下のような状況を想定する。 あるマーカーが陽性の時の真の有病率を$p_1$、あるマーカーが陰性の時の真の有病率を$p_2$とする ある集団では、陽性の$n_1$人のうち病気は$X_1$人であり、陰性の$n_2$人のうち病気は$X_2$人であった ある集団全体では$n=n_1+n…

層内に相関のあるK×2×2分割表の共通オッズ比の推測について

Liang KY. Odds ratio inference with dependent data. Biometrika 1985; 72(3): 678–682. k x 2 x 2表の共通オッズ比の推定で、独立な積二項モデルの仮定のもとではCMLEもMH推定量も一致性があるが、層内で相関がある(ベータ二項モデルなど)とMH推定量しか…

Time-dependent (varying) covariate / Time-dependent (varying) effect

比例ハザードモデルとその拡張のちょっとしたメモ。 色々調べると、time-dependent と time-varying は特に区別していない文献ばかりだった 当然 covariate と effect では意味が違うので注意 Proportional hazard $h(t, \mathbf{x}, \boldsymbol{\beta}) = …

Penalized quasi-likelihood について

GLMM の推定アルゴリズムに Penalized quasi-likelihood (PQL) という方法があるのですが、整理のためメモを書くことにしました。 PQL 混合効果モデルのパラメータ推定において、周辺尤度の積分を必要とする方法があることはよく知られていると思います。 GL…

Log-gamma distribution

A log-gamma random variable, $Y$, is defined as, \[ Y=\exp(-X) \] where $X \in [0, \infty)$ follows a gamma distribution, and $Y \in (0, 1]$. The probability density function of the log-gamma distribution is \[ f_Y(y)=\frac{b^a\left\{\log(…

行列のスカラー微分のメモ

$\mathbf{A}$, $\mathbf{B}$ について、スカラー $\theta$ で微分する場合を考える。 だたし、 \[ \mathbf{A}= \left\{ a_{ij} \right\}, \frac{\partial \mathbf{A}}{\partial \theta}= \left\{ \frac{\partial a_{ij}}{\partial \theta} \right\} \] とし…

一般化線型モデルの復習

仮定 確率分布 確率変数 $Y_i$ が互いに独立に canonical form の指数型分布族、 \[ f_{Y_i}(y_i)=\exp\left\{ [y_i \theta_i - b(\theta_i)] / \phi^2 - c(y_i, \phi) \right\}, \] に従う事を仮定する ($Y_i \overset{\rm{i.i.d.}}{\sim} f_{Y_i}(y_i)$)。…

最近のブーム

最近お勉強中のものをまとめてみよう。 推定関数、推定方程式 セミパラメトリックモデル Model miss-specification KLD Missing data 因果推論 情報幾何 数値解析 今までやってきたことが、いかに貧弱で、低レベルだったかということを再認識した。

On-line algorithm

分散のオンラインアルゴリズム (逐次更新計算)

負相関変量法・対称変量法

モンテカルロ法で積分値を推定する問題では、いくつかの分散減少法がしられています。 そのうちの一つである、antithetic variates method (負相関変量法・対称変量法) についてまとめてみようと思います。では、積分 \[ \int_a^b f(x) \mathrm{d}x= \int_0^…

単純モンテカルロ積分 (2)

今回も \[ \int_a^b f(x) \mathrm{d}x= \theta \] の様な積分値を推定する問題を考えます。このままでは $[0,\, 1]$ の一様乱数を利用できないので、 \[ x=a+(b-a)r \] \[ \frac{\mathrm{d}x}{\mathrm{d}r}=b-a \] \[ 0\leq r \leq 1 \] の置換積分を考えま…

単純モンテカルロ積分 (1)

単純モンテカルロ積分なんていう基礎的な事を復習してみました。自由度 $\nu=1$、分散共分散行列が \[ \mathbf{R}=\begin{pmatrix}1.0&0.7\\0.7&1.0\end{pmatrix} \] の 2 変量 $t$ 分布について、 \[ \int_{a_1}^{b_1}\int_{a_2}^{b_2}\mathrm{MVT}_2(t_1,\…

McNemar's test

以前は単なる対応データの割合が一致するかどうかの検定ぐらいの認識だったので、ちゃんと勉強してみようと思いました。 でも McNemar の原典 [3] を読むとさっぱり分からなかったので Kbauth 1985 [2] なども読みました。McNemar's test は、 \[ H_0:\, \pi…

Statistics Survays やら NCI The Biometric Research Branch の HP

お役立ちリンク情報。NCI The Biometric Research BranchReprints & Presentations から様々な文献がダウンロードできる。本もダウンロードできる、という情報を後輩からもらったので紹介。 Statistics SurvaysASA, IMS, Bernoulli, Statistical Society of …

正規線型モデルの条件付き推測

正規線型モデルとは書いたのですが、結局の所 $\mu$ なのか $X\beta$ なのかの違いだけなので、確率モデル \[ Y_{i} \overset{\mathrm{i.i.d.}}{\sim} \mathrm{N}(\mu, \s^2); i=1, \ldots, n, \] を考えます。この確率モデルのもとで、$\mathbf{Y}$ の同時…

局外パラメータを消す方法

最近勉強していると、必ずこの問題にぶつかるので、今のうちに整理しておこうと思う。 ここで、統計モデル \[ f(\mathbf{Y} \mid \boldsymbol{\theta}, \boldsymbol{\phi}), \] を考えよう ($\mathbf{Y}, \boldsymbol{\theta}, \boldsymbol{\phi}$ は全てベ…

t 分布の分布関数の導出

自由度 $\gamma$ の $t$ 分布の確率密度関数は、 \[ f(T=t\mid \gamma)= \frac{1}{\sqrt{\gamma}B\left(\frac{1}{2}, \frac{\gamma}{2}\right)}\left(1+\frac{t^2}{\gamma}\right)^{-\frac{1+\gamma}{2}} \] である。 ただし、$B(a, b)=\Gamma(a)\Gamma(b)/\…

指数型分布族

$n$ 個の独立な確率変数 $\mathbf{Y}$ が、$p$ 個のパラメータ $\boldsymbol{\theta}$ を持つ指数型分布に従うとすると、$\mathbf{Y}$ の確率密度関数は、 \[ \begin{align*} f(\mathbf{Y}=\mathbf{y} \mid \boldsymbol{\theta}) &= \left\{\prod_{i=1}^n f(…

一般化線型モデルと乱数

ちょっとだけ勉強したのでメモしておこう。 一般化線型モデル まず、確率変数ベクトル $\mathbf{Y}$ の期待値ベクトルを \[ \boldsymbol\theta=\mathrm{E}(\mathbf Y) \] と書いておきます。 一般化線型モデルと呼ばれている統計モデルでは、 \[ g(\boldsymb…

行列を用いない残差分散の不偏性の証明 (重み付き最小二乗法)

重み付き最小二乗法において、残差分散 \[ V_{e}= \frac{\sum_{i=1}^nw_i(Y_i-\hat{Y}_i)^2}{\phi_e},~ \phi_e=n-p \] が $\s^2$ の不偏推定量である事、すなわち \[ \mathrm{E}\left(\sum_{i=1}^n w_i e_i^2\right)=(n-p)\s^2 \] が成り立つ事を示したい。 …

Monte Carlo Error

新年初投稿、ちょっと調べ物をしたのでメモ。確率変数 $X$ の期待値 $\theta=\mathrm{E}(X)$ について、モンテカルロ法による近似を考える。 何らかの方法で、$X$ と同じ確率分布に従う $n$ 個の独立な乱数列 $X_i$ ($i=1, 2, \ldots, i, \ldots, n$) が得ら…

Satterthwaiteの近似 (2)

前回書いた結果をもとにして、ちゃんと近似できているのか試してみることにしました。 今回は Welch (1938) の (2) 式の統計量 \[ v=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}} \] を導出する過程で出てくる分布の近似を考えてみ…