New Procedure


  • CAUSALMED Procedure: Causal mediation analysis用のプロシジャですね (The CAUSALMED Procedure)。いくつかの方法で、直接効果・間接効果を分解した推定ができるようです。


コンパートメントモデルやcause-specific PHモデルなど実務で使いそうなものがサポートされています。

  • FREQ Procedure: COMMONRISKDIFFオプションでoverall risk differenceの推定値、信頼区間が出力されるようになった。METHOD=SCORE2オプションが追加され、リスク差やリスク比の正確な信頼区間の計算方法が追加された (Agresti and Min 2001)。Bowker’s symmetry testのexact版が追加された。(What’s New in SAS/STAT 14.3 FREQ Procedure)。
  • NLMIXED and MCMC Procedures: CMPTMODEL statementが追加され、コンパートメントモデルの解析が簡単に?できるようになった (CMPTMODEL Statement)。
  • PHREG Procedure: Cause-specific proportional hazards modelsのサポート (PHREG Procedure MODEL Statement)。
  • TTEST Procedure: ブートストラップ法に対応 (What’s New in SAS/STAT 14.3 TTEST Procedure)。


このページ に新情報が結構まとまっています。


New Procedures

最近は因果推論関係に力をいれているのか、procedure がふたつ追加されていました What's New in SAS/STAT 14.2 - New Procedures)。

  • CAUSALTRT Procedure: 二値 or 連続アウトカム、二値の治療変数の場合の average causal effect (ATT と ATE) を推定できる (The CAUSALTRT Procedure)。
  • PSMATCH Procedure: モデルを指定して簡単にマッチングが実施できる (The PSMATCH Procedure)。Exact マッチング、Mahalanobis distance マッチング、PS マッチングができる。


機能追加関連も、時間依存性ROC解析やNLMIXEDのマルチスレッド化など色々とあるようでした (What's New in SAS/STAT 14.2 - Highlights of Enhancements)。

  • PHREG Procedure: 時間依存性ROC解析に対応 (SUGI 2017 の paper に解説あり; Evaluating Predictive Accuracy of Survival Models with PROC PHREG)。Concordance Statistics (Harrell's C-statistic, Uno's C-statistic)、経時AUC・各時点のROC曲線の図示。
  • NLMIXED Procedure: 変量効果を指定している場合にマルチスレッド化して処理できるように (STAT14.1までは変量効果がある場合にNTHREADSを指定しても無視されていたらしいです)。

RcmdrPlugin.KMggplot2_0.2-4 is on CRAN

RcmdrPlugin.KMggplot2 v0.2-4 (an Rcmdr plug-in; a GUI for 'ggplot2') was released on Dec. 20, 2016.


Changes in version 0.2-4 (2016-12-20)
  • ggplot2 2.2.0 was supported.
  • Added ggplot2's colour/fill scales (scale_hue, scale_grey).
  • New plot: Beeswarm plot in Box plot (Thanks to DailyFunky @EpiFunky).
  • New function: lastcom() function to list the last command.
  • Fixed a bug: Histogram with missing values (Thanks to Dr. José G. Conde).
  • Fixed a bug: Boxplot with an inappropriate jitter position (Thanks to Dr. M. Felix Freshwater).

Beeswarm plot


Example: with box plot

Example: with CI

ggplot2's colour/fill scales



ggplot2-2.0.0 の拡張

ggproto と export

ggplot2 の v2.0.0 では OO の機構が ggproto というパッケージ内に含まれた独自のものに変更され、他のパッケージからの拡張が容易になったようです。
詳しくは、Extending ggplot2 に公式の解説があるので、これを熟読すると良いでしょう。
GeomXXX, geom_xxx, StatXXX, stat_xxx などが export されたので、かなり簡単に拡張が書けるようです。

独自の geom

私も自分のパッケージで独自の geom を作ってみました。
Kaplan-Meier plot という階段状の図を作図するコンポーネントで、信頼区間も階段状に帯の様に表示したかったので、geom_ribbon を継承し、前処理を少し加えたものを作成しました。

#' Step ribbon plots.
#' \code{geom_stepribbon} is an extension of the \code{geom_ribbon}, and
#' is optimized for Kaplan-Meier plots with pointwise confidence intervals
#' or a confidence band.
#' @section Aesthetics:
#' \Sexpr[results=rd,stage=build]{ggplot2:::rd_aesthetics("geom", "ribbon")}
#' @seealso
#'   \code{\link[ggplot2:geom_ribbon]{geom_ribbon}} \code{geom_stepribbon}
#'   inherits from \code{geom_ribbon}.
#' @inheritParams ggplot2:::geom_ribbon
#' @param kmplot If \code{TRUE}, missing values are replaced by the previous
#' values. This option is needed to make Kaplan-Meier plots if the last
#' observation has event, in which case the upper and lower values of the
#' last observation are missing. This processing is optimized for results
#' from the survfit function.
#' @examples
#' huron <- data.frame(year = 1875:1972, level = as.vector(LakeHuron))
#' h <- ggplot(huron, aes(year))
#' h + geom_stepribbon(aes(ymin = level - 1, ymax = level + 1), fill = "grey70") +
#'     geom_step(aes(y = level))
#' h + geom_ribbon(aes(ymin = level - 1, ymax = level + 1), fill = "grey70") +
#'     geom_line(aes(y = level))
#' @rdname geom_stepribbon
#' @importFrom ggplot2 layer GeomRibbon
#' @export
geom_stepribbon <- function(
  mapping = NULL, data = NULL, stat = "identity", position = "identity",
  na.rm = FALSE, show.legend = NA, inherit.aes = TRUE, kmplot = FALSE, ...) {
    data = data,
    mapping = mapping,
    stat = stat,
    geom = GeomStepribbon,
    position = position,
    show.legend = show.legend,
    inherit.aes = inherit.aes,
    params = list(
      na.rm = na.rm,
      kmplot = kmplot,

#' @rdname geom_stepribbon
#' @format NULL
#' @usage NULL
#' @export
GeomStepribbon <- ggproto(
  "GeomStepribbon", GeomRibbon, 
  extra_params = c("na.rm", "kmplot"),
  draw_group = function(data, panel_scales, coord, na.rm = FALSE) {
    if (na.rm) data <- data[complete.cases(data[c("x", "ymin", "ymax")]), ]
    data <- rbind(data, data)
    data <- data[order(data$x), ]
    data$x <- c(data$x[2:nrow(data)], NA)
    data <- data[complete.cases(data["x"]), ]
    GeomRibbon$draw_group(data, panel_scales, coord, na.rm = FALSE)
  setup_data = function(data, params) {
    if (params$kmplot) {
      data <- data[order(data$PANEL, data$group, data$x), ]
      tmpmin <- tmpmax <- NA
      for (i in 1:nrow(data)) {
        if ($ymin[i])) {
          data$ymin[i] <- tmpmin
        if ($ymax[i])) {
          data$ymax[i] <- tmpmax
        tmpmin <- data$ymin[i]
        tmpmax <- data$ymax[i]

継承しているため、ほぼ geom_ribbon のコピーですが、kmplot という引数を追加しています。
これは、survival パッケージの survfit という関数を内部で利用していて、この関数の出力を使う場合の例外処理の有無を指定できるようにしたかったので入れました。



  • ggproto(`_class` = NULL, `_inherit` = NULL, ...) となっていて、ひとつ目の引数がクラス名、ふたつ目が継承するオブジェクトなので、GeomRibbon を継承しています、geom を一から作成する場合は Geom を継承すれば良いと思います。
  • extra_params は追加引数名の指定です。geom_xxx の方で追加引数を入れた場合はここで指定していないとエラーになります。
  • draw_group は描画処理の部分ですが、今回はここで前処理をして GeomRibbon$draw_group を呼んでいます。
  • setup_data はデータのセットアップ処理の部分です、今回はここに例外処理を入れています。

実際には、Geom 内部で順番に継承している他の処理と上述の処理が呼ばれていくのですが、今回は一部で事足りてしまいました。


出力は、geom_stepribbon または以下のようになりました。

data(dataKm, package = "RcmdrPlugin.KMggplot2")

.df <- na.omit(data.frame(x = dataKm$time, y = dataKm$event, z = dataKm$trt))
.df <- .df[, .df[, c("z", "x"), drop = FALSE]), , drop = FALSE]
.fit <- survival::survfit(
  survival::Surv(time = x, event = y, type = "right") ~ z, .df)
.fit <- data.frame(x = .fit$time, y = .fit$surv, nrisk = .fit$n.risk, 
  nevent = .fit$n.event, ncensor= .fit$n.censor, upper = .fit$upper,
  lower = .fit$lower)
.df <- .df[!duplicated(.df[,c("x", "z")]), ]
.df <- .fit <- data.frame(.fit, .df[, c("z"), drop = FALSE])
.df <- .fit <- rbind(unique(data.frame(x = 0, y = 1, nrisk = NA, nevent = NA,
  ncensor = NA, upper = 1, lower = 1, .df[, c("z"), drop = FALSE])), .fit)
.cens <- subset(.fit, ncensor == 1)

ggplot(data = .fit, aes(x = x, y = y, colour = z)) + 
  RcmdrPlugin.KMggplot2::geom_stepribbon(data = .fit,
    aes(x = x, ymin = lower, ymax = upper, fill = z), alpha = 0.25,
    colour = "transparent", show.legend = FALSE, kmplot = TRUE) +
  geom_step(size = 1.5) +
  geom_linerange(data = .cens, aes(x = x, ymin = y, ymax = y + 0.02),
    size = 1.5) + 
  scale_x_continuous(breaks = seq(0, 21, by = 7), limits = c(0, 21)) + 
  scale_y_continuous(limits = c(0, 1), expand = c(0.01, 0)) + 
  scale_colour_brewer(palette = "Set1") +
  scale_fill_brewer(palette = "Set1") +
  xlab("Time from entry") +
  ylab("Proportion of survival") +
  labs(colour = "trt") +
  theme_bw(base_size = 14, base_family = "sans") + 
  theme(legend.position = "right")

因みに、geom_ribbon では帯は折れ線状につながるので geom_line と同じ感じです。
今回の、geom_stepribbon はある意味で geom_step と合わせて使うために作っています。
あと、geom_stepribbon の引数で colour = "transparent" とすると帯の端が透明にならないため、次のバージョンアップで colour = NA にでも変えようかと思っています。

geom-.r ファイル

また、geom-.r というファイルを roxygen2 のコメントを含めて読むと、仕組みがよくわかりました。

RcmdrPlugin.KMggplot2_0.2-3 now on CRAN

New version (v0.2-3) of 'RcmdrPlugin.KMggplot2' (an Rcmdr plug-in; a GUI for 'ggplot2') released.


Changes in version 0.2-3 (2015-12-30)
  • New geom_stepribbon().
  • Pointwise confidence intervals of Kaplan-Meier plots with band (Thanks to Dr. M. Felix Freshwater).
  • Notched box plots (Thanks to Dr. M. Felix Freshwater).
  • Stratified (colored) box plots (Thanks to Dr. M. Felix Freshwater).
Changes in version 0.2-2 (2015-12-22)
  • New ggplot2's theme (theme_linedraw, theme_light).
  • New ggthemes's themes (theme_base, theme_par).
  • Fixed a bug was caused by new ggplot2's theme.
  • Fixed a bug related to ggthemes 3.0.0.
  • Fixed a bug related to windows fonts.
  • Fixed a bug related to file saving.
  • Added a vignette for dataset requirements to make Kaplan-Meier plot.
  • Added a vignette for extrafont.


The geom_stepribbon is an extension of the geom_ribbon, and is optimized for Kaplan-Meier plots with pointwise confidence intervals or a confidence band.

geom_stepribbon(mapping = NULL, data = NULL, stat = "identity",
  position = "identity", na.rm = FALSE, show.legend = NA,
  inherit.aes = TRUE, kmplot = FALSE, ...)

The additional argument

  • kmplot
    • If TRUE, missing values are replaced by the previous values. This option is needed to make Kaplan-Meier plots if the last observation has an event, in which case the upper and lower values of the last observation are missing. This processing is optimized for results from the survfit function.

Other arguments are the same as the geom_ribbon.

data(dataKm, package = "RcmdrPlugin.KMggplot2")

.df <- na.omit(data.frame(x = dataKm$time, y = dataKm$event, z = dataKm$trt))
.df <- .df[, .df[, c("z", "x"), drop = FALSE]), , drop = FALSE]
.fit <- survival::survfit(
  survival::Surv(time = x, event = y, type = "right") ~ z, .df)
.fit <- data.frame(x = .fit$time, y = .fit$surv, nrisk = .fit$n.risk, 
  nevent = .fit$n.event, ncensor= .fit$n.censor, upper = .fit$upper,
  lower = .fit$lower)
.df <- .df[!duplicated(.df[,c("x", "z")]), ]
.df <- .fit <- data.frame(.fit, .df[, c("z"), drop = FALSE])
.df <- .fit <- rbind(unique(data.frame(x = 0, y = 1, nrisk = NA, nevent = NA,
  ncensor = NA, upper = 1, lower = 1, .df[, c("z"), drop = FALSE])), .fit)
.cens <- subset(.fit, ncensor == 1)

ggplot(data = .fit, aes(x = x, y = y, colour = z)) + 
  RcmdrPlugin.KMggplot2::geom_stepribbon(data = .fit,
    aes(x = x, ymin = lower, ymax = upper, fill = z), alpha = 0.25,
    colour = "transparent", show.legend = FALSE, kmplot = TRUE) +
  geom_step(size = 1.5) +
  geom_linerange(data = .cens, aes(x = x, ymin = y, ymax = y + 0.02),
    size = 1.5) + 
  scale_x_continuous(breaks = seq(0, 21, by = 7), limits = c(0, 21)) + 
  scale_y_continuous(limits = c(0, 1), expand = c(0.01, 0)) + 
  scale_colour_brewer(palette = "Set1") +
  scale_fill_brewer(palette = "Set1") +
  xlab("Time from entry") +
  ylab("Proportion of survival") +
  labs(colour = "trt") +
  theme_bw(base_size = 14, base_family = "sans") + 
  theme(legend.position = "right")

Pointwise confidence intervals of Kaplan-Meier plots with band

Notched box plots and stratified (colored) box plots

RcmdrPlugin.KMggplot2_0.2-1 is on CRAN now

I posted a new version of the "RcmdrPlugin.KMggplot2" package, which is an Rcmdr plug-in for a "ggplot2" GUI front-end.


Changes in version 0.2-1 (2015-12-14)
  • Kaplan-Meier plot: fixed a bug was caused by a tie data handling. (Thanks to Dr. M. Felix Freshwater).
  • Slovenian translation by Matjaž Jeran (Thanks to Matjaž Jeran and their friends).
  • New ggplot2's theme (theme_dark).
  • New ggthemes's themes (theme_calc, theme_fivethirtyeight, theme_gdocs, theme_hc, theme_pander).
  • Preview button (Thanks to Prof. Erich Neuwirth).
  • GUI refinement (Thanks to Prof. Erich Neuwirth).
  • Updates for release of the next version ggplot2.
Preview button

The new version has a preview mode.
You can make plots step-by-step.

Slovenian translation

  • theme_dark (ggplot2)

  • theme_calc (ggthemes)

  • theme_fivethirtyeight (ggthemes)

  • theme_gdocs (ggthemes)

  • theme_hc (ggthemes)

  • theme_pander (ggthemes)


そろそろ ggplot2 の最新版が CRAN にリリースされるようなので、自分のパッケージのメンテナンスをしました。


fun.args でパラメータを渡さないとエラー。

# <= 1.0.1
stat_summary( = "mean_cl_boot", geom = "errorbar", = .95, width = 0.1)

# > 1.0.1
stat_summary( = "mean_cl_boot", geom = "errorbar", width = 0.1, fun.args = list( = 0.95))


stat_paramsgeom_params を使うとエラーになる。

# <= 1.0.1
stat_boxplot(geom = "errorbar", stat_params = list(width = 0.5), geom_params = list())

# > 1.0.1
stat_boxplot(geom = "errorbar", width = 0.5)


show_guide を使うと警告 (deprecated)。
最新版では show.legend を使う様になった。

# <= 1.0.1
geom_xxx(..., show_guide = FALSE, ...)

# > 1.0.1
geom_xxx(..., show.legend = FALSE, ...)


grid::unitggplot2 上にインポートされるようになったため、呼び出しが楽になった。
grid::arrowscales::alpha も同様にインポートされるようになった。

# <= 1.0.1

# > 1.0.1