2019年度 度経済統計学会賞

受賞者:高橋将宜(鹿児島国際大学)

選考結果報告

選考対象著書および論文

著者:高橋将宜会員、渡辺美智子氏(共著)

『欠測データ処理:Rによる単一代入法と多重代入法』2017年,共立出版および以下9編の関連論文。
[1] 高橋将宜(2018)「多重代入法による匿名データの解析特性の改善について―全国消費実態調査を例に―」,『統計学』第114号, pp.15-29.
[2] Takahashi, M., Iwasaki, M., and Tsubaki, H. (2017) “Imputing the Mean of a Heteroskedastic Log-Normal Missing Variable: A Unified Approach to Ratio Imputation,” Statistical Journal of the IAOS, vol. 33, no.3, pp.763-776.
[3] Takahashi, M. (2017a) “Statistical Inference in Missing Data by MCMC and Non-MCMC Multiple Imputation Algorithms: Assessing the Effects of Between-Imputation Iterations,” Data Science Journal, vol. 16, no.37, pp.1-17.
[4] Takahashi, M. (2017b) “Multiple Ratio Imputation by the EMB Algorithm: Theory and Simulation,” Journal of Modern Applied Statistical Methods, vol. 16, no.1, pp.630-656.
[5] Takahashi, M. (2017c) “Implementing Multiple Ratio Imputation by the EMB Algorithm (R),” Journal of Modern Applied Statistical Methods, vol.16, no.1, pp.657-673.
[6] 高橋将宜(2017)「諸外国の公的統計における欠測値の対処法―集計値ベースと公開型ミクロデータの代入法―」,『統計学』第112号, pp.65-83.
[7] 高橋将宜・阿部穂日・野呂竜夫(2015)「公的統計における欠測値補定の研究:多重代入法と単一代入法」,『製表技術参考資料』no. 30, pp.1-95.
[8] 高橋将宜・伊藤孝之(2014)「様々な多重代入法アルゴリズムの比較~大規模経済系データを用いた分析~」, 『統計研究彙報』第71号, no. 3, pp.39-82.
[9] 高橋将宜・伊藤孝之(2013)「経済調査における売上高の欠測値補定方法について~多重代入法による精度の評価~」, 『統計研究彙報』第70号, no. 2, pp.19-86.

1.代表的な業績の概要と意義

ここでは高橋将宜・渡辺美智子(2017)(以下,「本書」)を選考対象業績の代表として取り上げ,その内容紹介を行うこととする。本書は,多重代入法の学術的理論と実用の双方をカバーし,多重代入法に特化した本邦初の書籍である。本書の全体を通じて,高橋会員の研究成果が反映されており,学術書としても評価できる。以下に,本書(全16章)の主な内容について,一連の論文との関係を示しながら,整理しておこう。
第1章では,実データを用いた実用的な分析を行うための環境を整えることと,完全データにおけるデータ分析の復習を兼ねる目的で,Rによるデータ解析を扱っている。
第2章では,欠測データ特有の問題点を議論している。すなわち,欠測パターンや欠測メカニズムといった事項を扱い,図やシミュレーションデータを用いて具体的に論じている。とくに,2.5節「MARについての注意点」には,[7]高橋・阿部・野呂(2015)の研究成果が反映されている。我が国の欠測データ解析の専門家の間では, MARとは「欠測する値に依存しない欠測」と解説されることがあるが,このような解説が誤っていることを示し,MARとNMARの違いは種類の違いではなく程度の違いであることを指摘している。
第3章では,確定的回帰代入法,確率的回帰代入法,比率代入法,平均値代入法,ホットデック法といった単一代入法を扱っている。これらは公的統計調査において多用されており,学術研究の土台に関わる手法である。[6]高橋(2017)で報告されているように,比率代入法は経済データによく用いられており,ホットデック法は世帯データによく用いられている。とくに3.3節において3種類の比率代入法を一般化した議論は,[2]Takahashi et al. (2017)の研究成果が反映されており,和文の文献では唯一の情報源となっている。
第6章では,和書として初めて,上書き代入法,欠測地図,密度の比較といった多重代入モデルの診断方法を扱っている。とりわけ,多重代入モデルの診断方法を3つのアルゴリズムすべてにおいて,統一的に扱った書籍は和文のみならず欧文においても存在せず,極めて貴重な資料といえる。また第6章後半では,[4]Takahashi (2017b),[5]Takahashi (2017c),[2]Takahashi et al. (2017)の研究成果が反映され,対数正規分布データの代入法を扱っている。一般に,代入モデルは多変量正規分布を仮定することが多いが,対数正規分布データに対して対数変換を施して正規分布で近似した場合,指数変換によって元のスケールに戻すことができないことを指摘し,解決策を提示している。
第7章から第12章は,政治・経済データを用いた分析結果とその再現方法を扱っており,計量経済学・計量政治学・データサイエンスといった実証研究分野への多重代入法の普及に貢献している。とくに,経済発展を被説明変数として,重回帰モデル,共分散分析モデル,ロジスティック回帰モデル,ARIMAモデル,固定効果モデルおよび変量効果モデルなど,さまざまな種類のデータ形式に対応するモデリングを扱っている。洋書を含めて,これほど具体的な内容を扱ったものはない。
第13章では欠測メカニズムが無作為ではないNMARの場合の対応策として,感度分析を扱っている。統計環境Rにおける具体的な実行方法も示しており,極めて実践的であり,感度分析の普及に貢献する内容となっている。第14章では,ベイズ理論に基づく多重代入法の真価を発揮させるべく,事前分布の導入を扱っている。この内容も和書としては初の試みとして高く評価できる。
最後に,本書で示された内容を応用して,[1]高橋(2018)では,全国消費実態調査を例として,公的統計調査の匿名データにおける解析特性の改善を議論している。[1]高橋(2018)は,データ提供者側の欠測データ処理だけではなく,データ使用者側の欠測データ処理という視点からも公的統計の匿名データの学術的活用の促進に貢献するものである。

2.選考結果

これまでの書籍では,実証分析に多重代入法を実際に活用するにはハードルがあったが,本書は,欠測データ解析の理論や数式を扱っていることはもちろんのこと,実際的な場面での使用にも耐えるよう,工夫が凝らされている。公的統計調査において重要となる単一代入法も扱っており,統計実務における貢献も大きい。
調査票情報や匿名化ミクロデータによる2次利用が統計的研究の有力手段となっている現代において,欠測値処理は避けて通れない課題である。高橋会員による多重代入法に関する本書及び一連の関連論文は本学会に対する有力な解法の提案となっている。
以上から総合的に判断し,学会賞選考委員会は本業績を著した高橋会員に対して2019年度経済統計学会賞を授与することとした。

2019年6月30日
学会賞選考委員会
PAGETOP