GIS

統計結果を見せる場合、視覚的に分かりやすい地図を使う場合がある。

以前はArcGISを使っていたけれど、最近はQGISを使うことの方が多い。Rと一緒でオープンソースというのは使いやすい。ArcGISにしても機能の十分の一も使っていない訳だし。まぁ、QGISも機能は豊富だけれど。

グアテマラのデータでGISを使う際の問題点はデータ不足。ここ10数年で市の数が増えたけど、しっかりアップデートされている市レベルのデータはあまり無いような気がする。

国勢調査が未だに2002年が最新のものなので今のところGISデータは農牧食糧省(MAGA)から購入した2005年のものを使っているけれど、国勢調査が終了する2018年中には新たなデータを手に入れたい。

Mortpak

全然知らなかったけどMortpakって今、無料なのね。

昔は結構高かった気がするけど。

なので、エクセルで計算したりマイクロデータがある時はポアソンにちょっと手を加えたネガティブ・バイノミアル・モデルとかを使っていたけどなぁ。

キチェ語話者数

キチェ語を話す人の総数は100万人以上とはよく言われるがその根拠というのが説得力に欠くものが多い。

2002年の国勢調査を改めて見てみた。15年前に集計されたデータだけど来年新たな国勢調査が発表されるまでは最新のものなのでこれを使う。  このセンサスでは3歳以上の人に対して言語の質問をしているのでデータを3歳以上の人口に絞る。

その後、話者数が多い5先住民言語のグラフを実数とパーセンテージで表したのがこちら。

母語、若しくは第二・第三言語としてグアテマラでキチェ語を喋る人は952,503人、四捨五入すれば百万人となるけれど百万人以上とはならない。まぁ、百万人に近いことは間違いないけど。15年前と比べてグアテマラの人口は大分増えたけどそれが先住民言語の話者数増加に繋がっているのかは判断し難い。どの程度喋れれば話者と数えることが出来るかによるかな。

パーセンテージのグラフがこれ。敢えてY軸の上限を100にした。キチェ語話者は三歳以上の人口の9.32%となっている。

どちらにしてもこれは15年前のデータなのでやはり現状を知るには新たなセンサスのマイクロ・データが欲しい。

Rコードはこちら

ソロラ県の女性

以前触れたソロラ県の女性の平均身長が世界一低いという件についてデータを調べてみた。

新聞記事にあった通り確かに平均身長は145CMで低いことは低いけど、ENSMI2014/15のデータによると幾つかの県の女性の平均身長はソロラ県の女性とあまり変わりがない。確かに貧しい県ではあるけど、平均身長が他の県と比べて低いのはやはり先住民率が高いことが主要因だと思う。特に西部の先住民は東部の人たちと比べても小柄そうだし。

Rのコードはこんな感じで。

今回は和色を使ってみた。藍色はソロラ県にも関係があると言える色。

 

身長

ちょっと古い記事だけどソロラ県の女性の平均身長は世界(調査対象国200カ国中)一低いらしい。グアテマラのデータも手に入れたことだし、ちょっと分布を県レベルで見てみようかな。

しかしこのデータ

変数が多すぎて限定しないとそもそもStataでは読み込めない。.doファイル読み込まないと。