都道府県市区町村
落書き帳

トップ > 落書き帳 >

メンバー紹介

>
YTさんの記事が10件見つかりました

… スポンサーリンク …



[87449] 2015年 4月 3日(金)18:47:54【1】YT さん
正規分布とのズレについて
[87448] オーナー グリグリさん
都道府県別の面積の丸め誤差をまとめて頂きありがとうございます。

以上の結果によると、全国の合計値の誤差(n=1921)が、0.25km2 となっていますが、[87439]における誤差(n=2000)の平均値 0.10km2 から大きく外れています。どこかに落とし穴があるのでしょうかねぇ。


|m| = a√{n/(6π)} = 0.1009... ≒ 0.10 km2 (n = 1921, a = 0.01)

は、蓄積された丸め誤差の平均(期待値)の絶対値です。蓄積された丸め誤差の標準偏差自体は

σ = a√(n/12) = 0.1265... ≒ 0.13 km2 (n = 1921, a = 0.01)

です。連続一様分布(アーウィン・ホール分布)に関しては、英語版のwikipediaに分かりやすい図と式がありました。を見ればわかるように、n ~ 8ぐらいで十分正規分布近似が可能となります。また説明にはvariance (分散, σ^2) = n/12 とありますが、この場合0から1までの連続一様分布を足した場合の分散であり、0~1とは限らない範囲0 ~ a(n回足せば、0 ~ naの範囲となる)であれば、分散σ^2 = a^2*n/12となり、標準偏差σは分散σ^2の平方根となるσ = a√(n/12)と表現されることになります。

全国の市区町村等別面積の合計と全国の面積との差である+0.25 km2は、一応±2σの範囲に収まり(正確には+0.245~+0.255の範囲を考慮すると、1.936σ~2.015σとなりますが)、受験でおなじみの偏差値であらわすのなら、偏差値69.8に相当する(正確には偏差値69.36~70.15の範囲)ので、多少丸め誤差の蓄積が予想よりも多めですが、一応許容範囲ではあると思われます。

[87439]のモデル表で言えば、丸め誤差が全く生じない確率(±0.005以下)は3%に過ぎない。
しかしながら生じる丸め誤差で一番確率が高いのは、±0.01 km2で、約6%の確率。
±0.10 km2の誤差が生じる確率は約5%程度だが、±0.10 km2以内に誤差が収まる確率は58%。±0.10 km2よりも誤差が大きくなる可能性は42%。
±0.25 km2の誤差が生じる確率はわずか1%だが、±0.25km2よりも誤差が大きく出る確率も、まだ5%あるという感じです。

都道府県別の[87448]のデータを使って、それぞれの実際の丸め誤差を、標本数から予測される標準偏差で割り、ズレを計算してみると:

ズレ都道府数割合(%)正規分布から期待される割合(%)
±3σ以上00.00.3
±2~3σ714.94.3
±1~2σ1123.427.2
±1σ以内2961.768.3

2σから3σまでずれる県が7県と、若干多いようです。ただし±3σ以上ずれている県はありません。具体的には以下の7県です。

都道府県誤差m, km2標本数n予測される標準偏差σ, km2ズレ
群馬県+0.05350.0171+2.93σ
富山県+0.03150.0112+2.68σ
佐賀県+0.03200.0129+2.32σ
新潟県-0.04370.0176-2.28σ
沖縄県+0.04420.0187+2.14σ
鹿児島県-0.04450.0194-2.07σ
埼玉県+0.05720.0245+2.04σ

こうやって並べてみると、確かに群馬県の誤差は大きいと言えます。また二番目の富山県などは、市町村数がたった15なのに、+0.03 km2も誤差が出ています。これらはありえないほど大きい誤差が出ていると言うほどではないが、やはり何かしら恣意的な原因もあるという可能性も否定できませんし、これだけのデータだけでは何とも言えません。あるいは四捨五入の際に、切り捨てというプロセスが混入してしまっている可能性もあるかもしれません。

群馬県・埼玉県については、[87423]でhmt さんが、m2単位のデータがあったことを指摘されていますが、もしかしたら具体的にどの辺が四捨五入の処理で問題になっているのか、あるいは単なる偶然なのか指摘できるかもしれません。

【±3σ以上の正規分布における割合を0.3%に修正、その他文章の一部を修正】
[87439] 2015年 3月 31日(火)23:39:06【4】YT さん
四捨五入に伴う面積の合計の丸め誤差についての統計学的考察
最近面積の改訂の話題が出ているので、久々に投稿します。

本来であれば面積は連続値であり、四捨五入に伴う丸め誤差が蓄積される結果、個々の自治体の面積の合計と国土の面積はズレて当たり前です。しかしながら2013年以前の国勢調査記載の面積の数字や陸軍参謀本部の調査による面積の数字においては、そのような丸め誤差が全くなく、市区町村別の面積の合計と、市郡別、都道府県別、国土の面積が完全に一致します (合衆国統治の琉球・沖縄の面積や1945年・1947年の面積などは、公式の数字で色々ズレがあるのですが、まあこれは除外して考えます)。平成26年の面積の改訂により、むしろ正しい面積の表記になったわけですが、チェックがし辛いという別の問題も出たわけですね。

面積の合計に伴う丸め誤差について、以前自分も[85659]で大雑把に見積もりましたが、

小数点以下第3位で四捨五入しているとすると、本当の面積のデータは±0.005 km2の範囲に存在し、四捨五入後の値との誤差の絶対値の平均は0.0025 km2となります。

ここの部分でズボラな結論で誤差を見積もったのですが、数学的な誤りがありました。そこで改めて四捨五入に伴う面積の合計の丸め誤差について見積もり直してみました。一応高校卒業レベルの微積・確率統計の知識で理解できる内容だと思います。

今、平均値m = 0で、±a/2の間に収まる連続一様分布を仮定します。∫f1(x)dx = 1になるように確率密度関数f1(x)を規格化すると、

|x| ≦ a/2: f1(x) = 1/a
|x| > a/2: f1(x) = 0 ...(1)

と表現できます。確率密度関数f1(x)の分散(σ1)^2は、[85659]で示したように(a/4)^2では誤りであり、ちゃんと積分により計算すると、

(σ1)^2 = ∫(x - m)^2*f1(x)dx (但し -∞ < x < +∞)
= 1/a ∫x^2dx (式(1)を代入, 但し -a/2 ≦ x ≦ a/2)
= a^2/12 ...(2)

さて、f1(x)同士を2つ足し合わせた時の確率密度関数f2(x)は、

|x| ≦ a: f2(x) = (a - |x|)/a^2
|x| > a: f2(x) = 0 ...(3)

分散(σ2)^2は
(σ2)^2 = ∫(x - m)^2*f2(x)dx (但し -∞ <x < +∞)
= 2/a^2 ∫ -x^3 + ax^2 dx (式(3)を代入, 但し 0 ≦ x ≦ a)
= a^2/6 (= 2*(σ1)^2) ...(4)

さらに3個、4個、…n個と、この確率密度関数を足し合わせていくと、確率密度関数fn(x)は、パスカルの三角形の組み合わせで継ぎ合わさったような、カクカクの複雑な多次多項式となります(アーウィン=ホール Irwin-Hall 分布)。ただしnが十分大きければ、確率密度関数は正規分布に近似できます。ここで分散(σn)^2は、個々の分散(σ1)^2の和なので、

(σn)^2 = n*a^2/12 ...(5)

となるはずです。実際n = 2の時も成立することを、式(4)で確認しました。

2013年以前の市町村別面積も小数第三位で四捨五入されており、±0.005 km2の誤差を含むはずです。よってn = 約2000の市区町村等の面積の合計であれば、a = 0.01 km2なので、(5)式に代入することにより、真の面積との間の丸め誤差の標準偏差は

σn = √(2000 × 0.01^2/12) ≒ 0.12909944 (km2)

になり、また丸め誤差の誤差分布も、σ ≒ 0.129 km2の正規分布に近似できることになるはずです。2000の自治体を合計した結果、小数点以下第2位まで一致する確率、すなわち± 0.005 km2の間に面積が入る確率は、標準正規分布のZ ≒ ±0.038729833 (≒ 0.005/0.12909944)の間に入る確率です。この範囲に入る割合は、エクセルのNORM関数を使って計算すると約3.0894%と求められます。つまり、2010年頃の約2000の市町村別等の面積の合計が、日本全国の面積の合計に一致する確率はわずか3%程度で、本当に面積が純粋な四捨五入だけで求めているのであれば「ありえない」確率ということになります。

また実数からどの程度ずれが生じてしまうかですが、平均が0、標準偏差がσとなるような正規分布の確率密度関数f(x)は、次のように表現できます。

f(x) = 1/√(2πσ^2) * exp {-x^2/(2σ^2)}...(6)

よってズレの平均値mは 0 ≦ x < +∞ の範囲のみを考えると、

m+ = ∫xf(x)dx (但し 0 ≦ x < +∞)
= 1/√(2πσ^2) ∫ x exp {-x^2/(2σ^2)} dx (式(6)を代入) ...(7)

ここでt = x^2/(2σ^2), x dx = σ^2 dt ...(8)と置いて(7)式に代入すると

m+ = σ/√(2π) ∫exp(-t) dt
= σ/√(2π)[exp{-x^2/(2σ^2)}] (但し 0 ≦ x < +∞)
= σ/√(2π) ... (9)

同じように負側の平均を積分で求めると、m- = -σ/√(2π) となり、合計m = m+ + m- = 0で平均はゼロになってしまいます。元々平均がゼロになる確率密度関数を選んでますので当たり前のことです。しかしながら、我々にとって正にズレようが負にズレようが、ズレていることには変わりなく、重要なのはズレxの絶対値の平均|m| = |m+| + |m-|です。よって

|m| = |m+| + |m-| = σ√(2/π) ...(10)

ここでσ = σn とすると、式(5)より

|m| = a √{n/(6π)} ...(11)

n = 2000, a = 0.01とすると、

|m| ≒ 0.10300645

というわけで、2000の自治体の面積の合計した際に生じる丸め誤差の平均を見積もっても、せいぜい±0.10 km2程度という結論がでます。

エクセルのNORM関数を使って、もう少し詳しくモデル計算(n = 2000)をしますと以下の通りです。

面積のズレ(km2)実数との差(km2)割合(%)割合の累積(%)標準偏差の累積σ(面積のズレの絶対値)×(割合)の累積(km2)
±0.00±0.000~0.0053.0893.0890.03870.00000
±0.01±0.005~0.0156.1609.2500.11620.00062
±0.02±0.015~0.0256.10515.3550.19360.00184
±0.03±0.025~0.0356.01421.3690.27110.00364
±0.04±0.035~0.0455.88927.2590.34860.00600
±0.05±0.045~0.0555.73332.9910.42600.00886
±0.06±0.055~0.0655.54738.5380.50350.01219
±0.07±0.065~0.0755.33543.8720.58090.01593
±0.08±0.075~0.0855.10048.9720.65840.02001
±0.09±0.085~0.0954.84653.8190.73590.02437
±0.10±0.095~0.1054.57858.3970.81330.02895
±0.11±0.105~0.1154.29962.6960.89080.03367
±0.12±0.115~0.1254.01266.7080.96820.03849
±0.13±0.125~0.1353.72270.4301.04570.04333
±0.14±0.135~0.1453.43373.8631.12320.04813
±0.15±0.145~0.1553.14777.0101.20060.05285
±0.16±0.155~0.1652.86879.8781.27810.05744
±0.17±0.165~0.1752.59882.4761.35550.06186
±0.18±0.175~0.1852.33984.8141.43300.06607
±0.19±0.185~0.1952.09386.9071.51050.07005
±0.20±0.195~0.2051.86288.7701.58790.07377
±0.21±0.205~0.2151.64790.4161.66540.07723
±0.22±0.215~0.2251.44891.8641.74280.08041
±0.23±0.225~0.2351.26593.1291.82030.08332
±0.24±0.235~0.2451.09994.2271.89780.08596
±0.25±0.245~0.2550.94895.1761.97520.08833
±0.26±0.255~0.2650.81495.9902.05270.09045
±0.27±0.265~0.2750.69496.6842.13010.09232
±0.28±0.275~0.2850.58997.2732.20760.09397
±0.29±0.285~0.2950.49697.7692.28510.09541
±0.30±0.295~0.3050.41698.1852.36250.09666
±0.31±0.305~0.3150.34698.5312.44000.09773
±0.32±0.315~0.3250.28798.8182.51740.09865
±0.33±0.325~0.3350.23699.0542.59490.09943
±0.34±0.335~0.3450.19399.2472.67240.10008
±0.35±0.345~0.3550.15799.4042.74980.10063
±0.36±0.355~0.3650.12799.5312.82730.10109
±0.37±0.365~0.3750.10299.6322.90470.10146
±0.38±0.375~0.3850.08199.7142.98220.10177
±0.39±0.385~0.3950.06599.7783.05970.10203
±0.40±0.395~0.4050.05199.8293.13710.10223
±0.41±0.405~0.4150.04099.8693.21460.10239
±0.42±0.415~0.4250.03199.9013.29200.10252
±0.43±0.425~0.4350.02499.9253.36950.10263
±0.44±0.435~0.4450.01999.9433.44700.10271
±0.45±0.445~0.4550.01499.9583.52440.10277
±0.46±0.455~0.4650.01199.9683.60190.10282
±0.47±0.465~0.4750.00899.9773.67930.10286
±0.48±0.475~0.4850.00699.9833.75680.10289
±0.49±0.485~0.4950.00599.9873.83430.10291
±0.50±0.495~0.5050.00399.9913.91170.10293

ズレが±0.00の割合と±0.01の割合では後者の方が倍近くになりますが、これは四捨五入して±0.01になる範囲が四捨五入して±0.00になる範囲の倍存在するからで、ここから値が大きくなるほど割合自体は減ります。50%の確率でズレは約±0.6745σ ≒ ±0.087 km2の間に入り、標準偏差 ±1σ ≒ ±0.129 km2の範囲に収まる確率は約68.27%となりますが、ズレの値にそれぞれの予想される割合を乗じて合計することで求まる、ズレの絶対値の平均はσ√(2/π) ≒ 0.7979σ ≒ 0.103 km2に収束します。

このようにちゃんと計算すると、モデル(小数点以下第三位で四捨五入し、2000個合計した場合)における丸め誤差の標準偏差σ = a√(n/12)≒ 0.13 km2 と、絶対値のみを考慮した場合の丸め誤差の平均値|m| = σ√(2/π) ≒ 0.10 km2 は一致しません。まあ[85659]で見積もった

2000前後の自治体でこの誤差を合算すると、二項分布を考えれば全国の面積合計で√2000 × 0.0025 ≒ 0.11 km2程度の丸め誤差は出て当たり前のはずですが、

の数字ともそんなに違わない値となりましたが、より正しい議論をすると以上のようになります。

以上をまとめると、小数点以下第三位で四捨五入した面積を約2000ほど足した場合、真の値との間に0.01 km2の誤差すら生じない確率はほとんどありえない(約3%程度)が、実際のズレは平均すると±0.10 km2程度ということになります。市区町村とその他未確定地域が合計約1万2000あった昭和10年の国勢調査であれば、丸め誤差の絶対値は平均0.25 km2にまで拡大します。1950年から2010年までの国勢調査報告書に記載の面積においては、総ての市区町村と未確定地域の面積の合計が全国・都道府県・郡市別面積と小数点以下第二位まで完全に一致しており、いささかの丸め誤差も存在しません。つまり2013年以前の面積調では、合計が一致するように端数を適当に処理し、実数とは異なる面積を公表していたことになります。
【追加修正:表に色々数字を追記し、説明文を修正】
[86844] 2014年 12月 28日(日)23:22:42YT さん
メンバー紹介について
[86808] オーナーグリグルさん
[86815] かぱぷうさん

最近生活環境が大いに変わり、落書き帳に余り書き込めておりませんYTです。というか、プライベートの方で非常に目出度いことがあったのですが、その結果として深夜にネットを閲覧したり書き込んだりするようなことができなくなったのです。

というわけで、[86806]のじゃごたろさんの書き込みと同様、私のメンバー紹介のところの、
書き込みの時間は深夜帯が多く、
文章作成中に睡魔が襲ってこないかを心配する向きもあるが、
睡眠の誘惑に打ち勝っている模様。

という部分が事実とは異なる状況になりつつあるので(まあ、数字や長文、歴史系の話題が多い傾向は続くでしょうが)、できれば深夜の書き込み云々の部分は適当にカットして頂くようお願いします。再び深夜に書き込むようになっていたら、それはプライベートが元に戻った時でしょう…

というわけで、オーナーグリグリ様、今後は書き込み頻度や情報の更新速度が相当遅くなるかと思いますが、今後ともよろしくお願いします。
[86490] 2014年 10月 26日(日)01:08:25【1】YT さん
アボガドロ数について
[86482] hmt さん

「N=6022垓1417京9千兆個の粒子を1モルとして纏めて扱う」


ちょっと地理の話題から脱線しますが、この手の基礎物理定数はCODATA (Committee on Data for Science and Technology; 科学技術データ委員会)が定期的(4年毎)に改訂するものです。hmt さんが書かれたアボガドロ数
NA = 6.02214179(30) × 10^23 mol^-1
は、2006年のCODATAの推奨値で、最新の2010年のCODATA推奨値によるアボガドロ数は、
NA = 6.02214129(27) × 10^23 mol^-1 (定数に対する標準誤差は4.4 × 10^-8)
となっております。

また2010 CODATAには間に合いませんでしたが、ケイ素の単結晶の解析(Andreas, B. et al. Phys. Rev. Lett. 2011, 106, 30801; Metrologia 2011, 48, S1)により、
NA = 6.02214082(18) × 10^23 mol^-1 (定数に対する標準誤差は3.0 × 10^-8; なおPRLの論文では NA = 6.02214078(18) × 10^23 mol^-1となっていた)
という実験結果が得られております。2014年のCODATAの第24回会議は来月11月上旬にニューデリーで開催される予定であり、その際にアボガドロ数の改訂が行われることになると思います。なおCODATAの会議は、1996年に日本の筑波で開催されたこともあるようです。

ところで上のアボガドロ数は、ケイ素の単結晶の解析実験により得ら得れた数字ですが、これはSI基本単位である「キログラム」や「モル」の再定義と直結する、極めて重要な問題を含んでおり、1ヶ月後には「定義値」になるかも知れません。

SI単位系といえば、長さがメートル(m)、質量がキログラム(kg)、時間が秒(s)、電流が(A)、温度が(K)、物質量がモル(mol)、光度がカンデラ(cd)ですが、この中で一番正確な定義がなされているのが、セシウム原子時計によって定義されている「秒」です。ただ原子時計に用いられるセシウム核種に混ざる不純物により、2.5 × 10^-11程度の相対的な誤差が出る可能性があり、将来的には定義に用いられる原子時計の核種が変わる可能性があります。

SI単位系ではおそらく一番馴染みが深いのが「メートル」でしょうが、現在はメートル原器ではなく、真空中の光速度による定義に変わっています。「真空中で「1秒」の299792458分の1の時間に光が進む行程の長さ」と定義文にあるように、長さの基本単位「メートル」は時間の基本単位である「秒」により定義されており、相対誤差(10^-10)も、時間の誤差よりも大きくなります。

「アンペア」と「カンデラ」の定義には「メートル」、「キログラム」(キログラムの定義については後述)、「秒」が、「モル」の定義にはアボガドロ数を介して「キログラム」が関わってきますので、これらの単位系の相対誤差は「メートル」、「キログラム」、「秒」よりも悪いものとなります。

温度の「ケルビン」は、「水の三重点の熱力学温度の 273.16分の1」という定義がなされていますが、そもそも温度というのは視覚的な測定が難しいため、建前上の定義と実用の間に大きな差があります。一応温度に関しては、測定温度範囲毎に膨張率の異なる金属を組み合わせるなどして測定するような、実用のための補正方法が別に決められていますが、室温付近でも10^-5程度の相対誤差は当たり前のように出ます。

さて、質量の単位である「キログラム」ですが、未だに「国際キログラム原器の質量」という、200年以上前の定義が使われています。各国に配られたキログラム原器を、0.1 μg単位(原器に対する誤差は10^-10)まで正確に計ることができる特殊な天秤で量ることで質量を校正するわけですが、キログラム原器とその複製品を比べると、200年間で±2σ ~ ±50μg程度 (相対誤差は10^-8のオーダー)のばらつきが出ていることが判っています。それにも関わらずキログラム原器が使われて来た理由は、これでも実用に問題無かったからですが、10年程前よりキログラム原器に替わる新しい定義として、(1) ワット天秤を用いたプランク定数による定義 と、(2) ケイ素単結晶を用いたアボガドロ数による定義 などが議論されるようになりました。現在プランク定数もアボガドロ数も、4.4 × 10^-8程度まで相対誤差が小さくなっており、これはキログラム原器に由来する質量の誤差が原因と考えられています。どちらをキログラムの定義に使うにせよ、プランク定数やアボガドロ数を定義値にすることにより、将来的に質量の潜在的な測定誤差が減ることが期待されるわけです。現状ではプランク定数による定義の方が優勢で、アボガドロ数はキログラムの定義には用いられない見通しになって来ましたが、モルの定義にはアボガドロ数が使われることになります。また電子素量により電流のアンペアの定義を、ボルツマン定数により温度のケルビンの定義を変えることも考えられており、来月11月の中旬にフランスのヴェルサイユ宮殿で開催される第25回国際度量衡総会により、「キログラム」、「モル」、「アンペア」、「ケルビン」の定義が変わるかも知れません。

なお国際度量衡総会の方は、フランスの外務大臣が議長を、フランスの科学アカデミー会長が司会進行を務め、必ずSI原器も保存されているセーヴル近辺で開催されることになっているようです。
[86370] 2014年 9月 10日(水)04:38:30YT さん
第一次府県統合と、それそれの府県での人口上位3位までの都市人口
[86367] アクアさん、初めまして。

2.非最大都市規模で非明治政府領を県庁に置いた県

おそらく旧領石高と城下町に比例関係があると仮定して都市規模を算出しているのでしょうが、大隈重信蔵書「府藩県石高人口表」を見てわかるように、石高と人口の相関は必ずしも良くありません。それに第一次府県統合では、各地に散らばっている各藩の飛び地を抹消しているので、単純に藩の石高で統合後の規模に順番を振るのもどうかと思います(旧高旧領取調帳で調べているのでしたらすみません)。

そこで明治6年頃の都市人口による各府県の人口上位3位までの都市と人口をまとめてみました。都市人口は『日本地誌提要』(明治6年1月1日調人口、[68751][68752][68793][68794][68845][68846][68962][68963][68964][68965]参照)を基礎とし、『明治八年 共武政表』(明治5年~8年の本籍人口)の人口を用いると各府県別での都市人口順位が上がる場合には『共武政表』の人口で補正しました(●印をつけた都市)。但し明らかに人口に誤りがある場合(『日本地誌提要』の鹿沼の人口と『共武政表』の気仙沼の人口など)はこの限りではありません。また県庁所在地が4位以下の場合は別途記載しました。

使府藩県M5人口1位人口2位人口3位人口4位以下人口
開拓使123,668箱館28,825小樽3,903札幌1,785
東京府779,361東京595,905千住11,368品川10,293
京都府567,334京都238,663伏水22,334亀岡7,029
大坂府530,885大坂271,992天王寺16,560難波8,128
琉球藩166,789首里44,984那覇14,610久米9,800
神奈川県492,714横浜64,602神奈川10,660八王子7,675
兵庫県198,559神戸・兵庫40,900尼ヶ崎12,404西之宮8,699
長崎県630,487長崎29,656島原18,682福江17,787
新潟県635,484新潟33,152新発田18,312村上17,647
埼玉県426,989成田(忍)7,224岩槻5,077幸手4,294浦和1,750
入間県410,952川越9,357熊谷4,171本庄3,573
足柄県339,582小田原12,710浦賀●7,081鎌倉6,420
木更津県574,652木更津4,381一之宮4,215鶴舞3,126
印旛県456,689船橋9,494古河9,343佐倉6,681流山●1,946
新治県470,509銚子17,688土浦7,788石岡6,938
茨城県366,505水戸19,010那珂湊8,254下館4,947
群馬県382,697前橋15,063高崎11,285沼田3,828
橡木県388,934館林9,007佐野4,960鹿沼●4,201栃木3,968
宇都宮県234,124宇都宮15,061烏山2,435大田原2,284
奈良県418,326奈良21,158郡山14,988御所町3,507
堺県446,85238,838岸和田8,852佐野5,388
安濃津県413,86522,080桑名18,064上野12,385
度会県363,732山田22,473松坂8,781鳥羽4,746
名古屋県604,116名古屋125,193熱田15,211一之宮7,399
額田県606,252岡崎12,969大浜8,885豊橋7,506
浜松県414,928浜松11,103新居6,438横須賀5,516
静岡県368,505静岡31,555沼津10,684島田●7,461
山梨県360,068甲府15,529市川4,095鰍沢3,562
大津県305,232五別所・大津17,924膳所6,371膳所6,371
長浜県271,332彦根24,368長浜5,369高宮●3,754
岐阜県660,896今泉・岐阜10,800大垣10,158八幡5,364
筑摩県550,841松本14,275高山13,081飯田8,944
長野県466,652松代7,976長野6,928小諸6,152
仙台県404,577仙台51,998石巻10,325馬場谷地●4,964
福島県268,576二本松10,435白河7,250福島5,813
平県242,906三春5,0864,241白石●3,313
若松県203,722若松20,588坂下2,972高田●1,987
一関県372,562水沢5,166気仙沼4,377一之関●4,365
盛岡県319,486盛岡21,306遠野●5,175花巻4,426
青森県473,244弘前32,886福山16,092青森10,965
山形県299,291山形17,631新庄8,361谷地6,587
置賜県130,293米沢24,945宮内2,858上小松●2,331
酒田県203,676鶴岡24,964酒田18,619大山3,430
秋田県582,297秋田38,118横手8,169本荘6,423
敦賀県199,819小浜19,271敦賀11,476武生9,416
福井県346,700福井39,784大野9,052坂井9,044
金沢県403,357金沢109,685小松9,970大聖寺9,416
七尾県397,511高岡23,724新湊18,904七尾8,216
新川県480,638富山44,682魚津10,098八尾5,981
柏崎県718,249高田27,460長岡24,067柏崎14,081
相川県103,098相川12,632夷町3,400小木2,602
豊岡県505,073宮津9,398舞鶴9,073出石6,796豊岡4,926
鳥取県385,531鳥取20,782米子10,237倉吉4,809
島根県340,042松江37,808杵築7,674広瀬3,877
浜田県259,611津和野7,088浜田3,943益田●2,503
飾磨県635,791姫路24,521明石14,410赤穂7,134
北条県215,602津山15,411真島(勝山)2,747久世1,749
岡山県387,459岡山32,372日生●3,511牛窓3,219
深津県546,430福山17,643鞆津●8,495笠岡6,415
広島県919,047広島74,305尾道9,722三原8,565
山口県827,53645,318赤間関18,500岩国11,684山口9,279
和歌山県556,919和歌山61,124新宮9,134田辺7,485
名東県750,985徳島48,861洲本7,267由良5,935
香川県559,712高松32,736丸亀13,875坂出6,465
松山県418,561松山26,141今治12,000川江5,860
宇和島県357,413宇和島12,209外海●6,280吉田5,042
高知県524,511高知39,757高岡5,827安芸4,479
福岡県441,175博多20,985福岡20,650秋月5,178
三潴県391,535久留米20,381柳河8,865瀬高3,860榎津2,555
小倉県304,574中津11,538小倉7,459長洲4,500
大分県562,318臼杵10,738大分6,8215,975
伊万里県506,667佐賀21,660厳原8,806唐津7,987伊万里4,005
熊本県513,593熊本44,620長洲5,706川尻4,712
八代県439,444八代9,021牛深7,590御領●6,017
都城県310,121国府17,144加治木9,386都城7,390
美々津県201,798宮崎11,929延岡6,861広瀬●3,884美々津1,881
鹿児島県670,864鹿児島●89,374加世田31,595鹿籠24,902


平県(磐城平:都市規模4位/6藩)
更津県(桜井:都市規模15位/15藩、天領1)
群馬県(高崎:都市規模3位/8藩、天領1)
埼玉県(岩槻:都市規模2位/2藩、天領1)*
額田県(岡崎:都市規模3位/10藩)
豊岡県(豊岡:都市規模8位/9藩、天領2)
大分県(府内:都市規模3位/7藩)

都市規模としては平は1位と大差のない2位、桜井(木更津内)は1位、高崎は1位と大差のない2位、岩槻は1位と大差のない2位、岡崎は1位、豊岡はやや1位と差のある5位(4位は篠山の5,931人)、大分はやや1位と差のある2位です。

1番、2番、3番、それ以下の差異をどの程度考慮するかにもよりますし、また明治22年の市制町村制施行までは「都市域」の定義が曖昧であるため、資料によって集計範囲が異なるという難点がありますが、一部の例外(浦和、流山、榎津、伊万里、美々津)を除き、当時の県庁所在地はその地域の中心となる都市が選ばれていることが判るかと思います。

この掲示板等でも、県によっては人身一心の理由で県名を改めたということが言われていますが、具体的にどのような資料でそのようなことが書かれているのでしょうか?

これは多分中央にはまとまった資料がなくて、個々に地方史をあたらないとわからないと思います。宮武外骨の『[府藩県制史]』における賞罰的県名論も、細かいところで矛盾がありますし。
[86357] 2014年 9月 3日(水)21:20:39YT さん
蛇落地からの改名は江戸時代?
最近色々私的に忙しかったのですが、久々に投稿します。

先日広島の災害地について流れたニュースによると:

崩れ落ちて形が変わった山を眺める住民たちは「20年住んでいますが、こんなことはとても思わなかった」と話す一方で、山肌を指さしながら「あそこが水の通り道だと聞いていましたね」と語る。一帯は「蛇落地悪谷」(じゃらくじあしだに)とよばれていたという。

平野孝太郎さん(71)は「昔は蛇が降るような水害が多かったので、悪い谷・悪谷と名がついたそうです。八木蛇落地悪谷が八木上楽地芦谷と改名され、さらにいまは八木だけが残ったようです」という。名前が変わるうちに「土砂崩れ」の教訓も忘れ去られたらしい。

130年つづく浄楽寺の住職によると、竜がいて、その首をはねたところから「蛇落地」とついたという。「竜は水の神で、水害を収めたということかもしれません。記録にはないが、語り継がれてきました」

近くの光廣神社に残る絵には、竜を討伐した武将のかたわらを激流が走る。こうした伝えは水害への警戒を促すと解釈できる。

これについて、日本歴史地名大系や角川地名辞典を調べましたが、蛇落地という地名を確認出来ませんでした。また地図資料編纂会『正式二万分一地形図集成』を閲覧したところ、明治31年測量、明治33年印刷・出版の地形図が収録されており、これが今回災害のあった地域の地形図の最古のものと思われます。[86330]でペーロケさんが指摘されておりますが、この段階で「山手」「上楽地」「小原」という地名が書かれており、改名はこれよりも古いものと推測されます。また『広島県史』によると浄楽寺は
由緒 元和五年創立、貞享五年寺号免許、もと仏護寺末。
とあり、130年どころか400年近く前の元和5年(1619年)の創立となっており、また角川地名辞典にも、130年前よりも前の明治7年に境内で小学校開校とあり、記事がちゃんと調べられずに書かれているように見受けられます。

さらに『佐東町史』を閲覧したところ、宝暦12年(1762年)の「沼田郡八木村地こぶり帳」という、芸藩時代の近世村としての八木村の検地帳が収録されており、そこに既に字名として本百姓8人の名前が記載されている「字 上楽寺」(上楽地・浄楽寺ではない)や本百姓1人の名前が記載されている「字 山ノ手」、本百姓36人の名前が記載されている「字 小原」などの記述があり、一方で「蛇落地」などという字名はなく、仮に蛇落地から上楽寺/地への改名が事実としても250年よりも前のこととなります。むしろ浄土真宗本願寺派である浄楽寺から上楽寺という字名となり、それが上楽地となったと考える方が素直です。

『佐東町史』には八木村の村会議員の選挙定員を決める明治13年の公文書が収録されており、それによると
一ノ部 議員一人 字鳴ル渡リ/十歩一
二ノ部 議員二人 字真蒲/上細野/中細野/下細野
三ノ部 議員一人 字代/一ツ矢
四ノ部 議員一人 字迫田/細田/田中
五ノ部 議員二人 字関城/柏谷/室屋/野地
六ノ部 議員一人 字上楽地/浄光院/小原
七ノ部 議員二人 字市/土居
となっており、明治13年の段階では既に「字 上楽地」の漢字が正式なものとなっております。なお宝暦12年の字の数は大小50個ほどですが、上の明治13年の段階では20個程に統合されており(これら字名はほぼ全てが宝暦12年の検地帳に記載されている)、おそらく大区小区制がらみの字の統廃合があったものと推測します。また「字 山手」が消えておりますが、こちらは明治13年~明治33年の間に復活したのでしょう。

宝暦12年と明治13年の間を補う地理書として、1820年代に完成した『芸藩通志』がありますが、こちらには近世村毎の地図が100枚前後収録されています。地図には字名が全て書かれているわけではありませんが、ヘツ所(別所)、浄楽寺、ムロヤ(室屋)、ノシ(野地)、コハラ(小原)などの地名を確認できます。芦谷という地名は確認できませんでしたが、別所古墳発掘調査報告書収録の地図に足谷遺跡というのがあり、宝暦の頃には字名としてはありませんでしたが、幕末にはアシヤと呼ばれる字名があり、明治の時に上楽地などに吸収されてしまった小字であると推測できます。何れにせよ『明治前期全国村名小字調査書』や角川地名辞典には旧八木村の明治初期の字名が漏れており、これ以上詳しく調べることはできませんでした。

最後に蛇の伝説ですが、これは江戸時代初期に書かれた『陰徳太平記』の「香川勝雄大蛇ヲ斬ル事」に詳しく載っており、天文元年(1532年)に香川勝雄が阿武山山中にて大蛇を倒したという話が既に17世紀には完成しておりました。物語によると香川勝雄は、阿武山の山頂に近い大きなカヤの木で眠っていた大蛇の首を切り落とし、落とした首が七八町飛んで「太刀ノブ」という湿地帯に落下し、さらにそれが飛び跳ねて一町先の「蛇王池」または「蛇王子」に落ちたとあります。『芸藩通志』附録の地図によると、阿武山(阿生山)の頂きの一つに「龍王」という地名があり、そこに大カヤと「竜王二社」があることになっています。「タチノフ」は麓の地名ということになっています。

『佐東町史』で「蛇落地」という地名に関して唯一触れているのが「蛇落地観世音像」ですが、これは弘化4年(1847年)に阿武山山頂にあった観音像を麓に移したとのことで、『芸藩通志』収録の八木村の地図では「龍王」の近くにある建物のマークの一つということになります。浄楽寺の住職によると蛇落地というのは蛇の首を切った場所と解説していますが、蛇の首を切った場所は阿武山山頂付近であり、蛇落地は山頂の地名といことになり、ますます上楽地との関係が不明となります。

結局のところ蛇落地が上楽地に改名されたというのは怪しく、仮に事実としても250年以上前のことです。また300年以上前にはすっかり地元の有力者が先祖の功績を讃える大蛇退治の物語として完成してしまっており、そこから土石流の伝承を読み説くことは不可能に近いといえます。大蛇退治の物語も、『陰徳太平記』の記述が『芸藩通志』や『広島県史』、『佐東町史』で繰り返し引用されており、『佐東町史』では地元なら誰でも知っている伝説とまで書かれています。そもそも今回土石流が発生した区域は「字 上楽地」だった地域でも「足谷遺跡」のある所でもなく、「字 小原」だった地域です。いくら地名が過去の教訓を示すと言っても、場所が微妙に異なります。そんなことよりハザードマップを周知徹底させたり、土砂災害警戒区域を設定するなど、最新の科学に頼った調査の方がはるかに重要で、信用出来ると言えます。
[85707] 2014年 6月 8日(日)17:42:58YT さん
今後の予定
これまでの人口や面積のデータは、この一つのファイルに集約されていると考えてよろしいでしょうか。

送ったファイルは作業のために列の順番が入れ替わっていますが、その通りです。

ただ、1950年~1970年の沖縄県、1950年の奄美の面積はまだ数字の入力が流動的ですし、1935年3月31日調の面積は入力が40%程度しか済んでいません。また1995年以降は統計局のデータベースから数字を流し込んだ結果、市区町村名と人口・面積のズレが発生している可能性があり、簡単な再チェックが必要です。中身をみて頂ければわかるように、送ったファイルはチェック用のSum関数が入ったままのシートだけですので、一回中身をテキストファイル経由で別のエクセルファイルにコピーしないと加工しにくいかと思いますが、所属未定地のみが残っている1980年以降の人口・面積の表はすぐに作れると思います。

自分の予定としては、1935年3月31日現在の面積を入力した後、1944年・1945年・1946年の人口調査、1948年の常住人口調査の人口を再チェックし、各種地方統計書のデータを元に1950年の面積の分割案を作った段階で次のまとめた結果をデータ(ver.0.2)として公表しようかと考えています。

その後、国勢調査報告書に載っている1920年~1930年の市・郡別面積を入力し、各種地方統計書のデータを元に1935年10月1日の面積合同分の分割案を出し、1935年10月1日~1948年の面積を独自調査で入力し、この段階でまとめた結果をデータとして公表(ver.0.3)。

これが終わったら、国勢調査以前の5回分の現住調査の人口を再チェック、明治22年~明治30年前の人口について、『日本帝国民籍戸口表』記載の現住人口と官報による現住人口を入力、明治22年以前について郡区別面積と、明治14年の郡区別面積を入力、などと予定を建てていますが、どうなるかは分かりません。
[85705] 2014年 6月 8日(日)13:09:10【1】YT さん
xlsよりもcsv
[85703] オーナー グリグリさん

すみません。

(1) 落書き帳に書き込む前に、公開したいデータのエクセルファイルを私宛にメールで送付。

この部分を見落としていました。

とはいっても総ての情報をエクセルにするのは作業が煩雑になるので、例えばカラム数が8以上、または一部のセルが折り返し表示になってしまうケースについては別個のファイルとして公開ということでよろしいでしょうか?その場合ですと、別に計算式の入力も必要ないので、例えばCSV形式などのテキストファイルでの公開の方が安全かも知れません。

【追記】

すみません。

さきほどオーナー グリグリ さんに、現時点でまとめ終えた面積・人口の情報を送付しましたが、ファイルの圧縮を忘れたため、10 Mb越えのファイルを送ってしまいました。

メールが読めない場合には、あらためて圧縮したファイルを送り直します。
[85704] 2014年 6月 8日(日)12:55:06【1】YT さん
エクセルファイルの公開について
[85703] オーナー グリグリさん

そこで今回のご指摘を受けて、当面は次のようにしたいのですが、YTさん、如何でしょうか。

(1) 落書き帳に書き込む前に、公開したいデータのエクセルファイルを私宛にメールで送付。
(2) エクセルファイルを当サイトのサーバの然るべき場所に格納する。
(3) 格納場所のリンク(URL)をYTさんに連絡する。
(4) そのリンクを利用してYTさんが書き込みを行う。
(5) ファイルの差替えなどもメールで行う。

御迷惑をおかけしてすみません。ただ、エクセルファイルの公開を暫時行うにはいろいろ問題があり、誠にすみませんが対応できません。

まず最近書き込んだ内容は、最終的にエクセルに纏める前の段階のものです。面積の情報は人口の情報以上に中途半端で、富山県下新川郡宇奈月町・朝日町の面積([85587]参照)の例のように、所属不明以外の面積情報の問題も1975年まで続いています。そのため公開するにもこういった面積不明・所属不明の情報の纏め方もまだ統一した状態になっていません(そのための問題点を、[85559][85587][85604][85605][85609][85623][85624][85659][85673]にまとめたつもりです)。こういった「市町村の情報をまとめるための個別の情報」というだけで、面積に関するものだけでもすでに20個以上のシート(バックアップを含めると確実に100個以上)を作成しています。公開するとなるとそこに含まれるであろう膨大な数の情報の再チェックも必要となり、作業量が現状よりも大幅に増えてしまいます。

二点目は、エクセルファイルそれ自体のセキュリティの問題です。エクセルは別名でセーブする度に個人情報が追加されますし、なぜか同名のファイルで作業していてもいつの間にか個人情報が追加されることがあります。公開する際にはかならずセキュリティチェックをしており自分の個人情報を消しているつもりですが、適時修正となるとそのチェックに不安が残ります。将来的にはエクセル以外の形式を用いるというのも手ですが、現状では自分のパソコンで作業する際にはエクセルが一番便利です。

三点目はファイルのサイズが大きくなりすぎている点です。普段一番メインに修正しているファイルのサイズはすでに40 Mbに達成していますが、メインとなるシートだけで別名で保存したところ、それだけでファイルサイズが10 Mbを超えました。

というわけでエクセルファイル形式での公開は避けたいと思います。

なお面積の方の入力ですが、現在1950年から2010年までの国勢調査時の市区町村別面積と、1935年の『昭和十年 全国市町村別面積調』記載の面積の内、大阪府以西分の入力は終わっています。ただ1950年の面積情報、そして1935年の面積情報についても、市区町村に分割されていないデータがあり、1935年~1950年の間の面積情報の拡張も可能かどうか現状では判りません。
[85702] 2014年 6月 8日(日)01:34:14【1】YT さん
面積調査の報告と東京都の昭和19年の人口について
[85701] ロム人 さん
YTさんがかなり積極的にご自身の調査内容を書き込んでいらっしゃるようですが、これはこれで有用な情報かもしれませんが、たしかかなり以前の過去ログを読んだ記憶では、このような(Wikipediaでいう)独自研究の書き込みは自身でサイトをたちあげて公表し、落書き帳でそのような発表をしないように促していたと思うのですが、その辺の立ち位置も変わってしまったのでしょうか?


すみません。私の方は普段の生活サイクルからしても、とても自分でホームページを立ち上げるほどの時間は取れません。

ただ、一応[84549]でアップした人口情報の内、抜けている情報(昭和19年の東京都の市区町村別人口)と、昭和10年以降の市町村別面積の遷移について、現時点での調査結果を報告しているのですが、これらの書き込みは迷惑でしょうか?

あと、(Wikipediaでいう)独自研究と言われておりますが、私は極力引用元を挙げて数字や元資料の客観性を保っているつもりなのですが、変遷情報や数字に恣意的なものが目立つのでしょうか?


… スポンサーリンク …


都道府県市区町村
落書き帳

パソコン表示スマホ表示