六連星手芸部員が何か書くよ

基本的には、ツイッターに自分が上げたネタのまとめ。アニメや漫画の感想、考察、レビュー、再現料理など。

お天気キャスター炎上に学ぶ統計的な考え方の重要性について

とあるお天気キャスターがTwitterに投稿した「たったひと月で驚きの寒さ」の一言と下記2枚の画像を巡っての炎上騒動ですが、理系と文系の噛み合わなさと捉えられている本件について、厳密に言えば統計の問題だと思われたので良い機会ですのでざっくり解説します。

2019/10/05/13:00

f:id:cerberus_cs:20191107055633p:image

2019/11/05/06:00
f:id:cerberus_cs:20191107055636p:image

 

①何が問題なの?

多くの方が指摘している通り、投稿された2枚のデータは気温の観測時刻が異なる為、比較対象としては不適切です。これに対して「最低気温がこんなに下がった事を表しているだけだから問題無い」「寒暖の差が問題だからこれで良い」と擁護する声もありますが実際はどうでしょうか?とりあえずこの2枚の画像からはわからない事をいくつか挙げると…

・10/05/06:00の気温は不明なので11/05/06:00と比べてみないと11月の朝が寒くなっているかはわからない

・同様に、11/05/13:00の気温は不明なので10/05/013:00と比べてみないと10月の日中の方が暑かったかはわからない

・両日の06:00と13:00の両方の気温が不明なので、1日の間で寒暖の差があったのかはわからない

と、いうことが言えると思われます。要するに10月の朝だってひょっとしたら11月と同じくらい寒かったかもしれないですが、これらのデータからはその情報を読む事が出来ません。実際にどうだったかは別として、本当に寒くなったかどうかは投稿されたデータからはまるでわからないのです。

 

②本件で扱われているデータを構成する要因とは?

情報を統計的に扱う際は、その情報を構成している要素が何であるかを考えます。今回の場合は日付と気温の2要因があるので、2×2要因の4群のデータを比較しない事には真偽はわかりません。

※実際には、1日だけのデータを比較対象とした場合、例えば台風や突発的な寒波、フェーン現象等の平均から逸脱した外れ値と重なる場合がある為、データとしては前後数日分を揃えないと不十分であり、前述の2要因に日数αや観測地点βが追加され、2×2×α×βといった具合に比較対象となる群は増えていきます(増やし過ぎると各々の要因が薄まって結果が求められない事も)。ただ、今回の場合はたまたま気象条件に大した差が無かった事と、あくまでこういう考え方をしますという話に留める為、1日ずつの観測地点も大まかに全体を俯瞰した比較です。(ついでに言及すると、上記の11/05/06:00の冷え込みはその日限定の突発的な寒波のデータを見せられている可能性もあったという事です)

さて、気象庁のデータベースが使い辛過ぎたのでtenki.jpからデータを引っ張ってきましたが、下記4枚の画像が2019/10/05、11/05の両日における6:00と13:00の気温です。

2019/10/05/06:00

f:id:cerberus_cs:20191107055849j:image

2019/10/05/13:00
f:id:cerberus_cs:20191107055844j:image

2019/11/05/06:00
f:id:cerberus_cs:20191107055841j:image

2019/11/05/13:00
f:id:cerberus_cs:20191107055846j:image

この4群を比較して初めて、両日の気温は06:00と13:00共に下がっているので、この両日に限って言えば1日を通した気温が低くなっている、と言えると思われます。10/05の06:00の気温は概ね20℃前後であるのに対し、11/05は概ね10℃前後、13:00の気温は30℃だったのが20℃前後になった感じでしょうか。結果的に言ってる事変わってないじゃんと思われるかもしれませんが、本来ならこのような比較をして初めて得られるデータであって、先の「驚きの寒さ」はただの当てずっぽうに過ぎません。つまるところ、数値の意味する情報が正しい否かは正確な比較対象を用意して確かめてみないとわからない、これが統計的な考え方をする上で基本的でありながら重要な点だと思います。

また、寒暖の差が〜という話もありましたが、これも両日の気温差を比較してみないと事実かどうかはわからない事です。という事で、10/05と11/05の最高気温と最低気温を比較します。

2019/10/05 最高気温と最低気温

f:id:cerberus_cs:20191107060002j:image

2019/11/05 最高気温と最低気温
f:id:cerberus_cs:20191107055959j:image

f:id:cerberus_cs:20191107071648j:image

実数値の差が分かりにくかったので一部抜粋して表にしました(天候が異なっていた北信越や亜熱帯の沖縄等を除く)。北海道や東北は寒暖の差が大きくなっていますが、本州では概ね1.5℃前後の開きに留まっているようです。確かに実際にデータを比較すると全国的に10/05より11/05の方が寒暖の差が大きいと言えますが、この差が人体に影響を与える有意な差(統計的に風邪の患者が増える、関節痛を起こしやすくなる等の意味のある差)があるかどうかは素人なので分かりません。それこそ、プロの意見を伺いたいです。

 

以上