散布図のようにデータが点在しているグラフでは、データの傾向を把握しやすくするために「近似曲線」を描画するケースが多い。Excelには近似曲線を追加する機能が用意されているため、数学(統計学)が得意でなくても、手軽に近似曲線を描画することが可能だ。ただし、「それが本当に信頼できるのか?」には十分に注意する必要がある。
近似曲線の追加
前回の連載では、「通勤時間」と「睡眠時間」の関係性を探るための「散布図」を作成した。ここに適当な「グラフ タイトル」を入力すると、以下の図のようなグラフに仕上げられる。
これだけでも「通勤時間」と「睡眠時間」に相関関係があることは何となく理解できるが、「近似曲線」を追加すると、より鮮明に傾向を把握できるようになる。
近似曲線は、各データを数学的に処理することで「妥当と思われるライン」(線)を描画したものだ。これにより、データの傾向を大まかなイメージではなく、数値(数式)として捉えられるようになる。
文章で説明するよりも実例を見た方が理解しやすいと思われるので、先ほどの散布図に「近似曲線」を追加してみよう。いずれかのマーカーを右クリックし、「近似曲線の追加」を選択する。
すると、画面右側に設定画面が表示される。ここでは、近似曲線の種類などを指定すればよい。たとえば、「直線」の近似曲線を描画したいときは「線形近似」を選択すればよい。
グラフに戻ると、以下の図のような「直線」が描画されているのを確認できる。これが「線形近似」の近似曲線となる。
この直線の「通勤時間」が65分と100分の地点に注目すると、「睡眠時間」が約7:45から約7:30に減少していることを確認できる。つまり、「通勤時間」が35分ほど長くなると「睡眠時間」は15分ほど短くなる、と考えられる。両者を5で割ると、7分の「通勤時間」につき3分ずつ「睡眠時間」が減少していく、と推測できる。
このように「近似曲線」を使うと、具体的な数値でデータの傾向を把握できるようになる。ただし、「この推測が本当に正しいか?」には疑問の余地が残る。というのも、「通勤時間」と「睡眠時間」が必ずしも直線的な関係性になるとは限らないからだ。
これについては後ほど詳しく検討するとして、続いては、描画した近似曲線の書式を変更する方法について紹介していこう。