== 統計グラフの種類と表し方 ==

このページでは,グラフの描き方をExcelを使って説明します.
1. 縦棒グラフ,横棒グラフ

1.1 棒グラフ
(1) 数量の大小を比較するのに適している
(2) 縦棒グラフでは棒の高さ,横棒グラフでは棒の横幅が数量を表す
【例1.1】
 右のグラフは,2019年都道府県別ぶどう出荷量(単位t)--農林水産省公表資料--を縦棒グラフにしたものです.
 元のデータは,北海道から始まる都道府県番号順に並んでいますが,グラフにするときは,
 A) 元の都道府県順,  B) 数量の多い順(少ない順)
が考えられます.このグラフではBの数量の多い順として,上位5県までと他の合計を表示したものです.
1.2 複数系列の棒グラフ
【例1.2】
 右のグラフは,平成29年と平成30年の都道府県別みかん出荷量(単位t)--農林水産省公表資料--を縦棒グラフにしたものです.
 このグラフでは上位6県までを表示したものです.
 このグラフのように,同一ラベル(都道府県)に対応する2つの年の数量を棒グラフにしたものは,複数系列の棒グラフと呼ばれます.
都道府県別みかん
出荷量(t)
平成29年平成30年
和歌山7,0707010
愛媛5,8105590
静岡5,1705110
熊本3,9303830
長崎3,0002890
佐賀2,2402120
 例えば,MicroSoft Excelでこのグラフを描くには,
 挿入→縦棒→2D縦棒
とすればよい.
1.3 複合グラフ
【例1.3】
 右のグラフは,2019年京都市の月毎の降水量(mm)と平均気温(°C)を1つのグラフにまとめたものです.
 このような複合グラフは,気温と降水量の関係?というような疑問に答えるための1つの手がかりを与える.
 MicroSoft Excelを使って,このグラフを描くには,(A) 例2と同様に複数系列の棒グラフを作成する→気温を表す縦棒グラフの1つを右クリック→系列グラフの種類の変更→折れ線グラフ,の手順で行うことができます.(B) 複数系列の折れ線グラフにしておいてから,降水量のグラフを棒グラフに変更しても同様の結果が得られます.
 この例のように,降水量の単位(m)の目盛りを左側に,気温(°C)の目盛りを右側に表示するには,(ABとも) 折れ線になった気温のグラフを右クリック→データ系列の書式設定→系列のオプション 第2軸(上/右側),の手順で行うことができます.

※統計で嘘をつかない
 右のグラフAは,政府統計/みかんの出荷量全国総計/5年間の変化をグラフにしたものです.
 このグラフに「いろりやこたつを囲む生活習慣の減少」「マニキュアやネイルアートをしている女性がみかんの皮むきを嫌う」といった分析の一文が添えられていると,みかん生産農家から見れば絶望的な状況を表しているかのように見えます.
 このグラフは政府統計を用いたもので,数値には誤魔化しはありませんし,分析の一文も全くの嘘を述べているわけではなさそうです.
 しかし,グラフAでは,みかんの出荷量が激減しているように見えますが,実際には5年間で約17%減少しただけです.大げさな議論になってしまうのは,グラフAは
@0が書かれていないために,比例の尺度が大げさに誇張されている.
A冗長な区間(0t〜600000t)を省略するときは,波線を用いてそこが省略されていることを示す必要がある.
これら2点を改善してグラフBのように直す方法を考えてみます.なお,Bグラフの塗りつぶしについても触れます.
 @Excelグラフで,グラフBのように0を書くには
 まず,左端の軸目盛を右クリック→軸の書式設定→軸のオプション→最小値550000とする.
 次に,表示形式→ユーザ設定として,#.##0;#.##0;となっている表示形式コード欄に,[=550000]"0";(550000の値を0と表示する)と書き込んで,追加ボタンを押す.
 A波線によってその区間が省略されていることを示すには
 Excelでは,この作業にちょうど合う選択肢が用意されていないので,各自で工夫します.
×挿入→図形→※ネット情報としては,(オートシェイプのうちで)星とリボンの内で最後のリボンを使うという方法がよく見られますが,このリボンは波が1つしか描けないので,私は採用しません.
〇挿入→図形→線の内の曲線を選びます.(このやり方では,波の山と谷は手作り感抜群のさじ加減になりますが,図のように意外とそれらしい物になります).  次に,その波線を右クリックして,図形の書式設定→幅3pt,二重線とすると,=のようになります.
 なお,BExcel2007特有の問題---(Excel2003以前とExcel2010以降ではグラフに対して「右上がり斜線」「右下がり斜線」などの「塗りつぶし」ができるが,Excel2007だけは「塗りつぶし」ができない)---に対応して,棒グラフを他の方法で塗りつぶす方法を考えてみる.
 ネット情報では,この塗りつぶしが可能なアドインが流布しているので,それをインストールするように書いてある記事が多く,それも参考にされるとよいでしょう.ここでは,外部プログラムを全く導入せずに「棒グラフの中に柄模様を描く」方法を示してみる.これができれば,その応用として,平成29年のグラフに示したような,小中学生に喜んでもらえる『かわいい系』のグラフに仕上げることも可能になる.
 Excel2007でも(他のバージョンでも)セルの書式として「右上がり斜線」「右下がり斜線」などの「塗りつぶし」はできる.そこで,右図のような絵をコピー貼り付けして,ペイントで保存します.このファイルを保存したフォルダ名ファイル名を覚えておいて,次の作業をします.
 棒グラフを右クリック→データ系列の書式設定→塗りつぶし→塗りつぶし(図またはラクスチァ)→ファイル(積み重ね)→(先ほど覚えた)ファイルを選ぶ→閉じる
 ※塗りつぶし(図またはラクスチァ)のときに,「ミカンの絵」「ネコの絵」などをあらかじめ保存しておいたイラストを指定すれば,グラフをそのイラストで埋めることができます.=平29のグラフ参照.ただし,このときにファイル(引き伸ばし)を選ぶと,平30で示したように元ファイルを引き伸ばして棒グラフを埋めたものになります.

【問題1.1】
都道府県総人口(男)総人口(女)
滋賀県7072
京都府124135
大阪府423458
兵庫県261287
奈良県6371
和歌山県4450
 右の表は,2018年度の近畿地方府県別男女別総人口の一覧表です.
 この表を基にして,下の見本のような複数系列棒グラフを作ってください.なお,この表には府県番号は書かれていませんが,府県番号はJISコードで決められており(滋賀県25〜和歌山県30),棒グラフに示す府県の順序はこのまま変更しない方がよい.
(解答例)
【問題1.2】
降水量(mm)平均気温(℃)
1月165.6
2月427.2
3月117.510.6
4月90.513.6
5月120.520
6月22521.8
7月19324.1
8月11028.4
9月19725.1
10月529.519.4
11月156.513.1
12月76.58.5
 右の表は,2019年東京都の月別降水量と気温です.
 この表を基にして,下の見本のような複号グラフを作ってください.
(解答例)
【問題1.3】
東 京428
北海道276
大 阪256
神奈川231
愛 知222
 右の表は,令和2年度都道府県別高等学校数の上位5都道府県一覧です.
 この表を基にして,下の見本のような波線付き省略グラフを作ってください.
(解答例)

1.4 積み上げ棒グラフ・帯グラフ
 次の表のような家計・支出表を棒グラフにしたい場合,
食費光熱
水道費
住居費衣服費通信費交通費医療費貯蓄
4月936541178280000220611448233539385000
5月715021515480000317114509393310095000
6月982971234080000267413164389716235000
7月85220906480000292810401227134125000
8月518421521880000261710932377214335000
 Excelで挿入→縦棒グラフを選ぶと,一旦,次の図のようになって,できてほしいものと違う形のグラフになります.
 月毎の支出の小計が表示されるようにするには,グラフをクリックしてから,Excel上端のメニューから,デザイン→行/列の入れ替え,を選びます.
 これにより,次のようなグラフに変わります.
 縦棒グラフにするか横棒グラフにするかは,途中からでも変更できます.
 グラフを右クリックしてから,グラフ種類の変更を選べばよい.
 積み上げ棒グラフで長さの揃った形で,百分率表示にしたものは,帯グラフと呼ばれ,各項目の「比率の変化」が分かりやすくなります.
 Excelで図のように対応する項目を線で結ぶには,グラフをクリックしてから,レイアウト→線→区分線,を選びます.
【問題1.4】
 右のグラフは,ある人の今年4月,5月の家計支出額を示したものです.
 このグラフの種類を答えてください.
解答を見る

2. 円グラフ

 各々の項目の全体に対する割合を分かりやすく示すために使われます.各項目を表す扇形の中心角の大小によって割合が示されます.
【例2.1】
 右のグラフは,国のある政策に対するアンケート集計結果だとします.
 アンケート結果のように各項目の割合を分かりやすく示すには,円グラフが適しています.
 円グラフは,ほぼ次の目安に沿って作られます.(「絶対に」とは言えませんが,次のように描く方が見やすく,多くの円グラフはこうなっています)
(A) 円は回れば同じに見えますが,項目として並べるには,時計盤の12時の角度から右回り(時計の針の回る方向)に並べます.(上の例では赤色の部分から右に回る)

(B) 各項目の並べ方に意味があるとき・・・例えば,このアンケートのように「肯定的な回答から否定的な回答へ」並んでいるときは,その順序に従って結果を表示した方が分かりやすいでしょう.

(C) あらかじめ予想する順序がないもの・・・例えば,すきなスポーツの種類を答える場合など・・・のときは,回答の多い順に表示する方がよいでしょう.ただし,「その他」「保留」「無回答」のように,他の内容が決まらなければそれ自体の内容が決まらないもの(他の項目の残りのようなもの)は,どんなに多い割合になっても最後に回すのがよいでしょう.(上の例では黒色の部分)

※小数が合わないとき
 右図のように,円グラフにデータラベルとして百分率を表示するとき,小数部分の四捨五入の具合(丸め方)によっては,表示された数値の合計が100%にならないのが普通です.(右図では99.9%)
 このような場合,読者が「計算間違いではないか?」と疑問を持つので,次のいずれかの方法で断り書きを付けるとよいでしょう.
(A) 「小数部分は四捨五入されているため,全体の合計は100%になりません」とそのまま書く.
(B) 比率が100%になるように,かつ,割合の変更が最も少なくなるように,最大の項目で調整する(この図で言えば42.3%→42.4%)
(C) 他に影響を与えない「その他」「無回答」の項目で調整する(この図で言えば6.3%→6.4%)
 いずれにせよ,調整した場合は,その旨を書く方がよいでしょう.

2.1 百分率を2つ示す場合
アンケート回答項目9月10月
大いに評価する1117
ある程度評価する3247
あまり評価しない2624
まったく評価しない2716
わからない・無回答77
103111
 右の表のようなアンケート集計をグラフにして,9月と10月での有権者の意識の変化を見やすく示すには,
(A) 円グラフを2つ並べて示す
(B) 次の図のような帯グラフで示す
のいずれかがよいでしょう.
 この例では,(B)の帯グラフの方がより見やすいでしょう.
【百分率の変化】
帯グラフで示す

3. 折れ線グラフ

 数量の時間的変化を示すのに適しています.(空間的な変化については,次の散布図を参照してください)
【例3.1】
 次の表は,2019年4月〜12月の京都市月毎の平均気温(°C)で,これを折れ線グラフに表したものが,右のグラフです.
Apr13.9
May20.7
Jun23.6
Jul26.4
Aug29.3
Sep26.2
Oct20
Nov12.9
Dec8.3

 このように,Excel折れ線グラフでは,「1列目の月の名」(=名義尺度のもの)が「横軸のラベル」になり,「2列目の量的データ」をy座標とする折れ線が描かれます.
 折れ線グラフを描くときに,温度のデータだけの1つの列を選択した場合,右のようなグラフになります.このとき横軸に付けられるラベルは月名ではなく,そのデータの番号になりますので,1は1月を表していません.このように折れ線グラフを作るときに,横軸のラベルを想定通りに付けるには,グラフのデータとして,横軸のラベルを含む列データを含めて指定するとよい.

3.1 複数系列折れ線グラフ
2009年2019年
1月6.85.6
2月7.87.2
3月1010.6
4月15.713.6
5月20.120
6月22.521.8
7月26.324.1
8月26.628.4
9月2325.1
10月1919.4
11月13.513.1
12月98.5
 右の表は,2009年と2019年の東京都の月別平均気温です.
 この例のように,2009年と2019年の2つの系列から成るデータを折れ線グラフにしたものは,複数系列折れ線グラフと呼ばれます.


4. 散布図

 棒グラフや折れ線グラフでは,主軸は必ず1目盛ずつ増えるように固定されており,これに対応して変化する1つの量的変数の値をy座標としてグラフにします.
【例4.1】
 次の表1のB列だけを選択して,棒グラフ,折れ線グラフにすると,グラフA,グラフBになります.表1のA列とB列の2列を選択して,棒グラフ,折れ線グラフにすると,グラフC,グラフDになります.
 横軸に月が入るだけで,「横は1目盛ずつ進む」「B列の値を縦(y座標)として使う」というルールでグラフが描かれます.
- 表1 -
A列B列
4月9
5月15
6月17
7月22
8月29
9月25
10月17

 これに対して,散布図は原則として2列の値を(x座標,y座標)の意味に解釈して点を打ちます.
 表2の桃色の範囲を選択して,挿入→散布図を選ぶと,右図のようなグラフになります.
- 表2 -
豊臣秀吉16060
平清盛16865
伊達政宗16555
上杉謙信15850
武田信玄15562
今川義元15353
織田信長16570


 グラフ中の赤で示した@〜Fは実際には表示されませんが,解説のために書き込んだもので,@豊臣秀吉,A平清盛〜F織田信長の順に点が表示されます.
 縦棒グラフや折れ線グラフと異なり,x座標を自由に設定できる所が特徴です.

4.1 平滑線マーカー付き散布図
 散布図では,「点(マーカー)だけ」「点(マーカー)を結ぶ曲線を付ける場合」「点(マーカー)を結ぶ折れ線を付ける場合」「点(マーカー)なしで線だけの場合」などが選べます.
 次の表3の全体を選択して,挿入→散布図(平滑線とマーカー)を選ぶと,右図のようなグラフが描けます.マーカーなしで曲線だけのグラフも描けます.(赤で示した矢印は,回る順序が分かるように書き込んだもので,Excelグラフにはない)
- 表3 -
xy
1.00 1.00
0.88 1.36
0.54 1.38
0.07 1.07
-0.42 0.49
-0.80 -0.20
-0.99 -0.85
-0.94 -1.29
-0.65 -1.41
-0.21 -1.19
0.28 -0.68
0.71 0.00
0.96 0.68

4.2 複数系列散布図
- 表4 -
xsin xcos x
0.0 0.00 1.00
0.2 0.20 0.98
0.4 0.39 0.92
0.6 0.56 0.83
0.8 0.72 0.70
1.0 0.84 0.54
1.2 0.93 0.36
1.4 0.99 0.17
1.6 1.00 −0.03
1.8 0.97 −0.23
2.0 0.91 −0.42
2.2 0.81 −0.59
2.4 0.68 −0.74
2.6 0.52 −0.86
2.8 0.33 −0.94
3.0 0.14 −0.99
3.2 −0.06 −1.00
3.4 −0.26 −0.97
 複数系列散布図のグラフを描くには,表4のようにx座標を共通の列に書き込み,y座標を別にして書き込みます.
 赤で示したグラフが y=sinx,青で示したグラフが y=cosxです.


 Excelでは,x座標に共通の値がなくても,y座標が別ならば,複数系列散布図がでます.
- 表5 -
降水量気温気温
(mm)(℃)(℃)
xy1y2
札幌那覇
1月113.6-3.6
2月94-3.1
3月77.80.6
4月56.87.1
5月53.112.4
6月46.816.7
7月8120.5
8月123.822.3
9月135.218.1
10月108.711.8
11月104.14.9
12月111.7-0.9
1月10717
2月119.717.1
3月161.418.9
4月165.721.4
5月231.624
6月247.226.8
7月141.428.9
8月240.528.7
9月260.527.6
10月152.925.2
11月110.222.1
12月102.818.7
 右の表5は,1981年〜2010年までの札幌と那覇の降水量-気温の月平均値です.
 降水量には共通の値はありませんが,x座標に降水量を並べます.気温の値は,札幌と那覇で別の列に書きます.
 これを折れ線散布図(マーカーなし)にすると,次のようなグラフができます.



5. ヒストグラム

 連続型の量的データを集計した度数分布表を柱状グラフで表したものがヒストグラムです.
最近のExcelでは
27, 25, 11, 79, 90, 45, 57, 76, 68, 6, 35, 72, 58, 52, 51, 95, 66, 35, 91, 13, 65, 91, 71, 64, 63, 81, 36, 34, 88
のような生の量的データが与えられたときに,度数分布表を求めてヒストグラムにする方法が選択肢の1つとして選べるようになっているものもあります.また,古いExcelでも分析ツールを利用すれば,生のデータから度数分布表とヒストグラムを書き出せますが,以下に述べるのはその話ではありません.
 以下に述べるように,「度数分布表が与えられたときに,ヒストグラムを作る方法」を考えます.
【例5.1】
- 表6 -
階級(得点)階級値人数
0≦x<2010 3
20≦x<4030 5
40≦x<6050 10
60≦x<8070 15
80≦x≦10090 7
 左の表6に示される度数分布表からヒストグラムを作る場合,桃色の背景色になっている2列の範囲を選択してから,棒グラフを選択してもヒストグラムにはなりません.

 縦棒グラフを選ぶと左図のように,階級値と人数の複数系列の棒グラフになります.これはヒストグラムではありません.
 ヒストグラムにするには,初めに2列の範囲を選択してから「散布図」を選びます.一旦,マーカーで示される点になりますので,次にグラフの領域を右クリックして「グラフの種類の変更」→縦棒グラフを選びます.
- 表7 -
階級(得点)人数
0≦x<20 3
20≦x<40 5
40≦x<60 10
60≦x<80 15
80≦x≦100 7

 表7のように1列目が文字データである場合,右図のように1列目を横軸のラベルに取り入れて棒グラフとして描くことはできます.ただし,単なる棒グラフとヒストグラムとでは,決定的に違うことがあります.
【ヒストグラムの特徴】
(1) 階級幅を等しく描くことが多いが,ヒストグラムとして階級幅は等しくなくてもよい.1つの長方形の「面積」が度数に比例していればよい.
階級幅を等しく描く場合は,柱の高さが度数に比例する.
(2) 棒グラフとは異なり,つながっている連続型のデータを必要に応じて区切っているだけだから,1つの柱と次の柱の「隙間はあけない」.
Excelで,ヒストグラムとして柱の隙間をあけないようにするには,柱状のグラフを右クリックしてから,データ系列の初期設定→要素の間隔なし(0%)とします.柱の境目が分からなくなった場合は,枠線の色,枠線のスタイルで分かるようにします.
柱の順序は階級値の順序に従って並べ,勝手に変えられない.
(#) 度数分布表をグラフで表すとき,ヒストグラムが用いられることが多いが,度数折れ線グラフ(度数多角形)で表す場合もある.

分布の形を表す用語
 ヒストグラムの形状を表すとき,言い方の決まった幾つかの用語が使われる.
ベル型 ベル型というのは,西洋の教会の鐘の形ということで,日本でよく見る釣り鐘の形ではない.どちらかといえば,「麦わら帽子の形」「マイフェアレディの帽子」「裾の長い富士山の形」のことをベル型と言い慣わしている.
 もっとはっきり言えば「正規分布曲線=ベル型」と考えればよい.
単峰型,多峰型 1つの山から成る分布は,単峰型と呼ばれる.これに対して,大人と子供を混ぜて身長の分布を調べたときのように,複数個の峰ができる分布は,多峰型(2つの峰からなるときは双峰型)と呼ばれる.
 分布が多峰型になる場合は,元の集団の中に大人と子供のように異質な集団が混ざっている可能性がある.ただし,高校入学時の英語や数学のように,好き嫌いがはっきり分かれてしまう教科の得点も多峰型になることがある.
左右対称型 ピーク(峰)から左右対称になる分布は左右対称型と呼ばれる.
 上記のベル型は「単峰型」かつ「左右対称型」と言えます.
歪んでいる,裾が長い 右の裾が長い分布は右にひずんでいるという.(この場合,峰は左寄りになることが多いが,峰ではなく,裾の位置で歪みの左右を言う)
 同様にして,左の裾が長い分布は左に歪んでいるという.
一様な分布 どの階級もほぼ同じ度数で分布していて,目立った山や谷が見られないものは,一様な分布と呼ばれる.

【問題5.1】
 右の度数分布表について,「ベル型」「単峰型」「多峰型」「左右対称型」「右に歪んでいる」「左に歪んでいる」「一様な分布」のうちで,当てはまる用語を選んでください.
 
解答を見る
【問題5.2】
 右のヒストグラムから,平均値,中央値,最頻値を求めてください.なお,中央値,最頻値については,それが含まれる階級幅を按分して答えてください.
(中央値,最頻値についてはこのページ参照)
 
解答を見る

6. 幹葉図

 幹葉図みきはずはデータの大きさ(総数)が比較的小さい場合に,数字を幹の部分(階級に対応)と葉の部分(個別の値)に分けて図式化したもの.
 度数分布表とは違って,幹葉図を作るときに値の省略(例えば,小数値は切り捨てるなど)がなければ,幹葉図から元のデータを復元することができる.
【例6.1】
- 表8 -
度数
09683
1162535
2758265
305154
45713
20
  27, 25, 11, 9, 30, 45, 47, 16, 28, 6,
  35, 12, 8, 22, 31, 15, 26, 35, 41, 13
の20個のデータについて,幹を10の位,葉を1の位として,幹葉図で表示すると,右の表のようになる.
【問題6.1】
 表8の幹葉図からヒストグラムを作成してください.
解答を見る

7. レーダーチャート

 正多角形(蜘蛛の巣の形)に配置して,中心から離れるほど大きい値を表す.項目同士のバランスを比較するのに適している.
【例7.1】
- 表9 -
英語数学国語社会理科
平清盛7080687656
織田信長8055656045
豊臣秀吉6542858175
武田信玄8570557070
 表9のデータでレーダーチャートを作成すると,次のグラフになる.
 デザイン→行/列の入れ替えによって,次のグラフになる.表現したい目的・目標に応じて,意味が伝わりやすい方を選ぶ.
【問題7.1】
- 表10 -
英語数学国語社会理科
平清盛7080687656
組平均7570758570
 右の表10のデータを使って,平清盛の得意教科・不得意教科が分かりやすいレーダーチャートを作ってください.
解答を見る

8. 度数分布表の備忘録

画線法
 画線法かくせんほうとは,線の本数で数字を表す方法のことをいう.筆算で度数を数え上げるときに使う.
漢字圏(日本ほか)では正の字で5を表す
英語圏ではタリー記号(tally:[動詞]記録する,集計する)で5を表す
Excelを用いた度数分布表の作成
...(PC版)メニューに戻る