「テスト結果」や「利用者の年齢」といった、雑多な数値データをグラフ化したい場合もあるだろう。このような場合は、数値データを適当な範囲に分けて、それぞれの範囲内にある「データの個数」を集計するとよい。このようなグラフのことを「ヒストグラム」と呼ぶ。今回はヒストグラムの作成手順を紹介していこう。
ヒストグラム(度数分布図)とは?
今回は、以下のデータをグラフ化する場合について考えてみよう。このデータは、あるグループがTOEICを受験したときのテスト結果をまとめたものだ。
それぞれの数値データ(テストの点数)は、805、655、950、770、490、・・・といった具合にバラバラの値が並んおり、全部で200件分(200名分)のデータがある。このデータを基に「集合縦棒」のグラフを作成すると、以下のような結果になる。
分類(氏名)の数が200件もあるため、とても使えるようなグラフにはならない。正直な話、「このグラフから何を読み取ればよいのか?」という状況になってしまう。
こういった雑多なデータをグラフ化するときは、「ヒストグラム」(度数分布図)と呼ばれるグラフを作成するのが一般的だ。
上図の例では、数値データを「100刻みの範囲」に分け、それぞれの範囲内にある「データの個数」(頻度)を集計してグラフ化している。
このようなグラフを作成するには、「200点以下のデータは△個」、「201~300点のデータは☆個」、「301~400点のデータは◇個」、・・・という具合に、それぞれの範囲内にある「データの個数」をあらかじめカウントしておく必要がある。とはいえ、これを手作業で行おうとすると、非常に面倒な前準備を強いられることになる。
たとえば、今回の例は全部で200件のデータがあるため、各データが「どこに分類されるか?」を「正」の字などでカウントしていく作業を200回も繰り返さなければならない。これを手作業で行うとなれば、カウントミスを犯す可能性も十分にあり得るだろう。
そこで、Excelのグラフ機能を使ってヒストグラムを作成する方法を覚えておくとよい。この機能を使うとExcelが自動的に「データの個数」をカウントしてくれるため、ほんの数分でヒストグラムを作成できる。自分で「データの個数」を数える必要はない。