箱ひげ図では、四分位を使用して数値の分布と中心傾向を視覚化および比較できます。 四分位は、最小値、第 1 四分位値、中央値、第 3 四分位値、最大値という 5 つのキー値に基づいて数値を 4 つの等しいグループに分割する方法です。
次の図の箱部分には、中央の 50 パーセントのデータ値 (四分位範囲、IQR とも呼ばれる) が示されます。 これらの値の中央値は箱を半分に分割するラインとして描画されます。 IQR は一連の値の変動を表します。 IQR が大きい場合、値が広く分散していることを意味し、IQR が小さい場合、大部分の値が中心近くにあることを意味します。 箱ひげ図では、ボックスから伸びるひげ (線) を使用して最小データ値と最大データ値も示されます。また、ひげを越えて広がるポイントとして外れ値を示すこともできます。
例
以下の箱ひげ図は、1800 〜 2040 年における 20 年間隔の大陸別の平均寿命の分布を示しています。
- [数値フィールド] -Life expectancy
- [カテゴリ] - Year
- [分割] - Continent
- [外れ値の表示] - 有効
同じ箱ひげ図は平均ラインを使用しても表示できます。
データ
[データ] タブ の構成には、箱ひげ図を作成するために使用される変数が含まれます。
変数
箱ひげ図は、X 軸と Y 軸で構成されています。 X 軸では、カテゴリまたは数値変数ごとに 1 つの箱が割り当てられます。 Y 軸は、一連の数値内で最小値、第 1 四分位値、中央値、第 3 四分位値、最大値を測定するために使用されます。
箱ひげ図を使用すると、1 つまたは多数の分布を視覚化できます。 単一の分布を視覚化するには、1 つの [数値フィールド] 変数を追加します。 これにより、選択した数値属性の分布を視覚化する 1 つの箱ひげ図を含むチャートが生成されます。
さらに、他の [数値フィールド] 変数を追加して、テーブル内の別々の属性フィールドから提供される複数の分布を比較できます。 たとえば、郡のデータセットで、Population2010 と Population2015 が [数値フィールド] 変数として追加されるとします。 結果として生成されるチャートには 2 つの箱ひげ図が表示されます。1 つはデータセット内のすべての郡について Population2010 の分布を視覚化し、もう 1 つは Population2015 の分布を視覚化するためのものです。
箱ひげ図が複数の数値フィールドから作成されるとき、Z スコア標準化がデフォルトで適用されます。 標準化により、異なる単位の数値変数を比較できるようになります。
たとえば、収入 (万単位の値) の分布と失業率 (0 ~ 1.0 の範囲の値) の分布を比較する箱ひげ図は、標準化なしで読み取ることが困難になります。これは、失業率の値が収入値よりもはるかに小さいためです。
属性値の標準化には、Z 変換が含まれます。この変換では、すべての値の平均を各値から引いた後、その結果をすべての値の標準偏差で割ります。 Z スコア標準化は、すべての属性を同じ縮尺にして、複数の分布を同じチャートに表示できるようにします。 その代わりに、生の値を表示する場合は、[値の標準化 (z スコア)] をオフにします。
[数値フィールド] 変数が 1 つだけ追加された場合は、カテゴリ間で分布を比較する方法として [カテゴリ] 変数を追加できます。 たとえば、郡のデータセットで、Population2010 が [数値フィールド] 変数として、StateName が [カテゴリ] 変数として設定されるとします。 結果として生成されるチャートには、州ごとに 1 つの箱ひげ図が表示されます。この箱ひげ図では、各州に属するすべての郡について Population2010 の分布が視覚化されます。
複数のシリーズ
複数のシリーズの箱ひげ図は、異なるタイプまたは異なるカテゴリの分布の比較に使用できます。
複数のシリーズの箱ひげ図はカテゴリ フィールドと複数の数値フィールドを指定するか、分割カテゴリ フィールドを指定することで作成できます。
複数の [数値フィールド] 変数を持つ [カテゴリ] 変数を使用すると、数値フィールドがシリーズ テーブルに追加されるごとにシリーズが作成されます。 たとえば、郡のデータセットで StateName が [カテゴリ] 変数として設定され、Population2010、Population2015、Population2020 が [数値フィールド] 変数として設定されるとします。 結果として生成されるチャートでは、カテゴリとして州が X 軸に示され、州ごとに 3 つのシリーズ (Population2010、Population2015、Population2020) が表示されます。
あるいは、データをさらに分割し、複数のシリーズを作成する方法として [分割] 変数を追加できます。 たとえば、郡のデータセットで、Population2010 が [数値フィールド] 変数として、StateName が [カテゴリ] 変数として設定され、さらに ElectionWinner が [分割] フィールドとして設定されるとします。 結果として生成されるチャートには、横に並んだ 2 つの箱ひげ図が州ごとに表示されます (合計で 100 個の箱ひげ図)。1 つは各州で ElectionWinner 値として Democrat を持つすべての郡について、もう 1 つは各州で ElectionWinner 値として Republican を持つすべての郡について Population2010 の分布を視覚化します。
[分割] フィールドは、[カテゴリ] 変数の代わりに複数の [数値フィールド] 変数が使用される場合にも使用できます。 たとえば、郡のデータセットで、Population2010、Population2015、Population2020 が [数値フィールド] 変数として、ElectionWinner が [分割] フィールドとして設定されるとします。 結果として生成されるチャートでは、X 軸に 3 つの [数値フィールド] 変数 (Population2010、Population2015、Population2020) が表示され、フィールドごとに、横に並んだ 2 つの箱ひげ図が示されます。1 つは ElectionWinner 値として Democrat を持つすべての郡の分布を表示し、もう 1 つは ElectionWinner 値として Republican を持つすべての郡の分布を表示します。
外れ値
[外れ値の表示] を有効にすることで、ひげから伸びたポイントとして外れ値を表示できます。 有効にしなければ、ひげはすべてのデータ ポイントを網羅するよう伸びます。
並べ替え順
箱ひげ図は、カテゴリのアルファベット順に自動的に並べ替えられます ([X 軸昇順])。 この並べ替えは、[並べ替え] パラメーターを使用して変更できます。 箱ひげ図では、次の並べ替えオプションが利用できます。
- [X 軸昇順] - カテゴリは、左から右にアルファベットの昇順に並べられます。
- [X 軸降順] - カテゴリは、アルファベットの降順に並べられます。
- [平均昇順] - 箱は、平均統計の昇順に並べられます。
- [平均降順] - 箱は、平均統計の降順に並べられます。
- [中央値昇順] - 箱は、中央値統計の昇順に並べられます。
- [中央値降順] - 箱は、中央値統計の降順に並べられます。
系列
[シリーズ] タブ の構成を使用して、箱ひげ図上の箱の色とラベルを変更します。
複数のシリーズを作成する際に [分割] フィールドを指定した場合は、[複数のシリーズを表示] も使用できます。 次のような表示オプションがあります。
- [並べて表示] - 横に並んだ箱ひげ図を、シリーズごとに 1 つずつ作成します。
- [平均ライン] - [カテゴリ] または [数値フィールド] 変数ごとに 1 つの箱ひげ図が作成され、[分割] フィールドのそれぞれ一意の値の平均を表示するためにラインが使用されます。
軸
[軸] タブ の構成を使用して、X 軸と Y 軸の仕様を変更します。
X 軸
カテゴリ ラベルは、デフォルトで 11 文字に切詰められます。 ラベルが切り詰められているときは、ラベルの上にマウス ポインターを置くことでフルテキストを表示できます。 チャート内のラベル テキストの全体を表示するには、[ラベル文字制限] の値を増やします。
Y 軸
デフォルトの Y 軸範囲は、Y 軸上に表示されるデータ値の範囲に基づいています。 これらの値は、[下限] または [上限] に値を入力することでカスタマイズできます。 Y 軸の境界を設定すると、チャートの縮尺を一定に保つことができ、値を比較する際に役立ちます。 [リセット] ボタンをクリックすると、軸境界がデフォルト値に戻ります。
小数点以下の表示桁数や、桁区切り記号の表示を指定して、Y 軸に数値を表示する方法を書式設定できます。
ガイド
[ガイド] タブ の構成を使用して、チャートにガイドの範囲を追加します。
参照または重要な値をハイライト表示する方法として、ガイドのラインまたは範囲を追加できます。 [ガイドの追加] ボタンをクリックすると、ガイドが Y 軸に追加されます。
ガイドのラインを作成するには、ラインが描画される [開始] 値を入力します。 ガイドの範囲を作成するには、[開始] 値と [終了] 値を入力します。 ガイドのラインまたは範囲の外観を変更することもできます。 ラインの場合、スタイル、幅、色を更新できます。 範囲の場合、塗りつぶし色を更新できます。
必要に応じて、[ガイド名] パラメーターを使用してガイドの名前を変更したり、[ガイドのラベル] パラメーター ([中央値] など) を使用してテキストをガイドに追加したりできます。
[表示] パラメーターの [前面] および [背面] ボタンを使用すると、ガイドがチャートの前面または背面のいずれにレンダリングされるかを選択できます。
形式
[書式設定] タブ の構成を使用して、テキスト エレメントやシンボル エレメントを書式設定することで、チャートの外観を変更します。
チャートの書式設定オプションには次のものがあります。
- [テキスト エレメント] - チャートのタイトル、X 軸のタイトル、Y 軸のタイトル、凡例のタイトル、説明テキスト、凡例テキスト、軸ラベル、およびデータ ラベルに使用されるフォントのサイズ、色、およびスタイル。 Ctrl キーを押しながらクリックしてエレメントを選択すると、複数のエレメントの形式を一度に変更できます。
- [シンボル エレメント] - グリッド線および軸線の色、幅、スタイル ([実線]、[点線]、[破線]) と、チャートの背景色。
一般
[一般] タブ の構成を使用して、チャート、軸、および凡例のタイトルを更新します。
チャートおよび軸のデフォルトのタイトルは、変数名およびチャート タイプに基づいています。 タイトルは、[一般] タブで編集したりオフにしたりできます。 [凡例のタイトル] パラメーターにタイトルを入力することもできます。 [凡例の配置] は、[右]、[左]、[上]、または [下] に設定することができます。 [説明] パラメーターにチャートの説明を追加することもできます。 説明は、チャート ウィンドウの下部に表示される一連のテキストです。
リソース
チャートについてより詳しく学習するには、次のリソースをご利用ください。