先日納会後の二次会、宴も闌というところで突然後輩さんからこんなことを質問されました。
住所ジオコーディングで求めたポイントを地域メッシュごとに集計しているお客様がいます。お客様からジオコーディングしたときの測地系が「日本測地系2000」なので、「日本測地系2011」に変換して再集計しなければいけないのですか?と質問されたのですけど、実際どうなんですか?どうなんすか?
今回は住所ジオコーディングで作成されたポイント(以下「住所ポイント」といいます)の精度と使い方についてお話します。
目次
「日本測地系2000→日本測地系2011」の場合
日本測地系2011 が登場する契機となった 2011年の東日本大震災では東北地方で最大 5m の地殻変動がありました。住所ポイントの位置も動いたことになるので下図のように再集計が必要だと思ってしまいますが、本当に再集計が必要なのかを考えていきます。
住所の意味するところ
ここで「住所ポイント」とは何かを考えてみます。本来、住所は点(ポイント)ではありません。日本の住所は土地の番号である地番や街区や道路フロンテージを基にした住居番号が由来なので、ポリゴンかラインでとらえるのが適当です。しかし、データ量が大きく扱いが複雑になるので「代表点」というポイントにしてデータ量を押さえ、使い方を容易にしています。地番は建物由来ではなく土地由来ですが、土地由来であっても建物内にポイントを落とすのが一般的です。建物が土地の中心でない場合もあるため、住所ポイントの代表点は必ずしも示すべき区域の中心点とはなりません。このことからも住所ポイントが 2つのメッシュのどちらにも含まれる可能性があることが分かります。
住所データの精度
例えば、10m 四方の家屋ポリゴンで考えると点の座標精度には 10m 許容できる誤差があります。住所ポイントの取得元となる家屋ポリゴンのデータ精度にも依存します。10m 四方以上の敷地を持つ建物もありますので、地殻変動によって代表点の位置が 5m ずれたとしても誤差の範囲内と言えます。
地殻は常に動いている
2016年の熊本地震では最大 1.5m の地殻変動が生じましたが測地系は変更されていません。厳密に測量する分野の方はセミ・ダイナミック補正を適用して座標を求めたりしますが、住所ポイントの作成でここまで考慮されている例は聞いたことがありません。大地は 1.5m も動いているのに住所ポイントの座標は変わっていないのです。ここからも住所ポイントの座標値が適当なものだと言えます。
ラスター モデルの特性
地域メッシュのような一律に分割された格子に値を集計する方法をラスター モデルといいます(グリッド モデルやテッセレーション モデルともいいます)。今日では地域メッシュのデータはポリゴンで作られている場合が多いですが、これをポリゴンメッシュともいいます。ポリゴンはデータ実装としてはベクター モデルに分類されますが、概念としてはラスター モデルです。
ラスター モデルはデータ サイズが軽量化できるといったメリットを持つ反面、セル(メッシュ、グリッドと同義)の大きさによって位置を特定する能力に限界があるといったデメリットがあります。地域メッシュのセルは非常に大きいのでデメリットの特性を理解する必要があります。
自宅のライブラリーに古いけど分かりやすい解説があったので引用します。『マンガでみる コンピュータマッピング入門』監修/久保幸夫・絵/矢藤一博 「測量」1987年1月号~12月号(Vol.37)連載
住所ポイントが 10m 四方ある建物やそれ以上の面積を持つ地番の代表点ということから、ポイントの座標が 5m 移動したとしても誤差の範囲ということは分かっていただると思います。
「日本測地系→日本測地系2000」の場合
それでは「日本測地系→日本測地系2000」のように数百m ずれる場合はどうなるのでしょうか。
地域メッシュの示す範囲は緯度経度で管理されており、測地系が変わっても緯度経度の数値は変わっていません。そのため、「日本測地系→日本測地系2000」では同じメッシュコードで示すべき範囲が 400m~500m 北西方向にシフトする、つまり示す範囲が変わったということです。
この場合は、住所ポイントも日本測地系2000 に変換して集計し直すのが理想です。
しかし、データによっては元の住所ポイントが存在しておらず、メッシュ内に格納された集計値だけでなんとかしたいというケースも多いようで、よく質問を伺いました。
日本測地系と世界測地系とでは地域メッシュの示す範囲が違う
ここでいう「世界測地系」とは「日本測地系2000」と「日本測地系2011」 両方を意味します。
繰り返しますが、地域メッシュは日本の国土を緯度経度を基にして一定間隔に区切った格子です。もともと行政管理庁(現在の総務省)の告示ですが、現在は JIS X 0410:2002 地域メッシュコードとして規格化されています。経緯などはこちらに記載があります。世界測地系へ移行の際、即座にすべてのデータは移行できないことから、2002年2月の規格改訂において、2012年2月までの 10年間は日本測地系に基づいた地域メッシュを併用できるという追補があり、これを「地域メッシュコードN」と呼ひました。現在はこの追補は失効していますので、すべての地域メッシュ データは世界測地系である日本測地系2000/2011 に移行されているはずで、「日本測地系→日本測地系2000」に移行する問題は存在しないはずです。はずですが現実といていまだに地域メッシュコードN のままのデータも散見します。
では、日本測地系の地域メッシュコードN で示される範囲を世界測地系に変換し、日本測地系2000 の地域メッシュコードとで比較するとどれくらい面積差分があるのかを調べてみました。
メッシュ種類 | ID(図郭名) | メッシュ面積 (km2) | 重複面積 (km2) | 面積差分 (%) |
---|---|---|---|---|
1次メッシュ | 5339(東京) | 6694.91 | 6640.22 | 0.82 |
2次メッシュ | 533900(やまきた) | 105.01 | 99.34 | 5.40 |
3次メッシュ | 53390000 | 1.05 | 0.48 | 54.29 |
※面積は各メッシュ ポリゴンの四隅の頂点を結んだ四角形を UTM図法に投影して計算
経験上、1次メッシュであれば面積は 1% 未満なので面積按分して再計算しても元データとの差違が見られず、メッシュ データの空間参照を世界測地系に上書きしても問題ないと考えます。2次メッシュも同様です。3次メッシュになると 50% 以上の差分があるので面積按分が必要に思いますが、がんばって按分して再集計した場合とそのままシフトさせた場合とで集計値の傾向が変わったということはありませんでした。あくまで経験上の主観ですが。
今回は東京付近のメッシュで検証しました。ちなみに、近傍のメッシュはほぼ同じ面積ですが、最北端と最南端とでは 25%も面積が異なる点にも注意が必要です(参考)。
地域メッシュの面積按分は集計する前の住所ポイントが存在しない場合の最終手段であり、基本的には住所ポイントから地域メッシュに再集計するのが望ましいです。
まとめ
測地系の移行に伴う地域メッシュの再集計の必要性は以下の通りです。
- 「日本測地系2000→日本測地系2011」の場合
住所ポイントは「代表点」なので、地殻変動でポイントの座標が移動したからといって測地系を考慮して再集計しても有意ではない。住所ポイントの取得精度を考えること。 - 「日本測地系→日本測地系2000」の場合
住所ポイント データがあるなら再集計するべき。メッシュ データしかない場合、経験上面積按分しても傾向が変わるほどの差違はでない。
今回の質問は前者の場合なので、再集計しても統計上の差違はないが答えとなります。