【理論と実践】分布と検定と分析と(経営情報システム)

2023年7月17日

~病院職員が、安心して、仕事の生産性高く、充実して働ける未来の一助へ~

ご友人等へのメルマガ紹介はこちらから。
https://www.mag2.com/m/0001682907
ーーーーーーーーーーーーーーーーーーー
令和5年7月12日 病院経営の理論と実践 1896号

■分布と検定と分析と(経営情報システム)

中神勇輝(なかがみゆうき)
ーーーーーーーーーーーーーーーーーーー

おはようございます。中神です。

〜今日のテーマ〜

本日の内容は、経営情報システム、過去問から学びのシェアです。
同友館の「過去問完全マスター」が参考図書です。

検定や分布です。
めちゃくちゃ苦手な部分です(笑)
過去問に出ていた分ぐらい押さえておきたいと思います。

今回は、やや長めです!

【令和元年度 第24問】(計量分析技法)

○問い

以下の文章の空欄A~Cに入る数値の組み合わせとして、最も適切なものを下記 の解答群から選べ。
集積した数値データを分析する際に、
データの値の大きさやばらつきの目安となるような特性値に注目することがある。

あるスーパーマーケットで 10日間毎日、サンドイッチの売上個数を調査し、
小さい順に並べたデータが以下に示されている。

(46  48  50  50  51  51  53  53  53  55)

このとき、
サンドイッチの 1 日当たり売上個数の平均は「A」 、
メディアンは「B」、
平均偏差は「C」である。

○答え

・平均値は、合計が510なので、「51」ですね。
・メディアンとは、中央値のことです。昇順に並べた際に順位が真ん中の値です。
「51」ですね。
・平均偏差は、平均に対する残渣の絶対値の平均です。
つまり、(5  3  1  1  0  0  2  2  2  4)= 20を算出します。
差の「20」を10で割って、「2」ですね。

メディアンなど、言葉自体知らなかったら、答えようがないので、押さえておきたい用語です。

【平成22年度 第25問】(確率)

○問い

当社工場で製造した製品100個の全数検査をした。
このうち10個にAタイプの欠陥が、6個にBタイプの欠陥があり、以上のうち3個には両方の欠陥があった。
この100個の中から無作為に抜き出した製品1個にAタイプの欠陥があったとき、
これにBタイプの欠陥もある確率として最も近い数値はどれか。

○答え

全数検査を行った場合に、Aタイプの欠陥があった10個のうち、3個に両方の欠陥があったとのことです。
100個の中から無作為に抜き出した製品1個にAタイプの結果が欠陥があった時(10個)に、
Bタイプの欠陥もある(つまり両方の欠陥がある)確率は、3個÷10個で求められます。

つまり「0.3」ですね。
3割の確率です。なかなか高いです。

【平成25年 第24問】(確率分布)

○問い

ある工場では、旋盤で切削・研削して、ある製品を出荷している。
平均して製品 3,000 個に1個の割合で不良品が出る。
この製品を 1,000 個ずつ箱詰めして出荷する時、箱に不良品が含まれない確率を求めたい。
この計算に最も適する分布はどれか。

○答え

・ボアソン分布ですね。

起きる確率が 非常に低い多数の独立事象の分析を近似する際に使用します。
今回は、個別の事象について、確率を問われていますし、
3000分の1という少ない確率、という点で合致しますね。

それ以外の分布も設問で問われています。

・指数分布は、
ある事象が発生する間隔の分布です。来客間隔の分析等に利用します。

・正規分布は、
身長や体重など、平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布です。

・超幾何(ちょうきか)分布は、
ベルヌーイ試行(AかBの事象しか発生しない事象)において、
母集団から、n個の標本を取り出したときに、そのうち、Aの事象がx回発生する確率を表現した分布です。

いろいろな分布がありますね。
全てを網羅することは、試験対策上、非効率なので、これぐらいにしておきます(^_^;)

【平成25年 第25問】(検定)

○問い

統計的仮説を検定する方法には様々なものがあり、適切に使い分ける必要がある。
以下の文章の空欄A〜Cに入る用語の組み合わせとして、最も適切なものを下記の解答群から選べ。

母分散が未知の2つの母集団の平均の差を検定したい。
2つの母集団からそれぞれ独立に、十分に大きな数の標本を採取できる場合には、
標本平均は正規分布に従うと考えて、
標本の不偏分散を母分散の代わりに使って 「A」を適用できる。
少数の標本しか得られない場合には、母分散の信頼できる推定ができないので、「A」を使えない。
しかし、2つの母集団が共に正規分布をし分散が等しい場合には、「B」が利用できる。
その場合、2つの母集団の分散が等しいことを検定するには、「C」を利用することができる。

○答え

「A」に入るのは、「z検定」です。

2つの母集団の母分散が既知である場合、母集団を「標準正規分布」を用いた検定(z検定)を使えます。
では、今回の事例のように母分散が未知であっても、十分に大きな数の標本を採取できる場合は、どうなるでしょうか?
多くの標本を採取できる場合、「標本平均は正規分布に従う」と考えて、標本の不偏分散を母分散の代わりに使用することで、Z検定を行えます。

「B」に入るのは、「t検定」です。

少数の標本しか得られない場合であっても、2つの母集団が共に正規分布をして、分散が欲しい場合に利用できます。

「C」に入るのは、「F検定」です。

t検定の条件である「2つの母集団の分散が等しい」ことを検定する際に使用します。

F検定を前提としT検定、ということでしょう。

【令和2年度 第24問、平成29年 第24問】(分析)

・分散分析

複数の対象について、それぞれの平均値の差異を分析する手法ですね。

例えば、ある企業には 3 つの事業部があるとします。
事業部ごとの売上高利益率の日次データが与えられている場合に、
この 3 つの事業部で売上高利益率に差異が見られるのかを検討する際に使えます。

・回帰分析

複数の因子(パラメーター)間の関係式を求めます。
求める結果と、結果に影響を与える各変数ごとの因果関係の強さを定量化します。
その因果関係の状況を、経営判断等に利用することができます。

例えば、ある商品の売上高の日次データと、
その商品の売上高に関係があると想定されるいくつかの変数のデータがある場合に、
どの変数が売上高にどの程度寄与しているのかを検討することができます。

・クラスター分析

異なるデータをいくつかの因子(パラメーター)に基づいてグループ分けする手法です。

数千人の顧客について、属性データ(男女・所得・購入履歴など)や趣味・嗜好に関するデータがあるとします。
その顧客の特性にあったマーケティング活動のために、顧客を分類する場合に使えます。

・A/B分析

Web サイトの候補として 2 つのパターンがあります。
どちらのパターンを採用するかを決める場合などに使えます。

・因子分析

複数の因子(パラメーター)を、対象とする事象と相関関係の強い因子に絞り込む際に使用します。

分析手法は、言葉が意味もわかりやすいですし、
現場でも使いやすそうですね。
頑張りたいと思います!

これで、経営情報システムは一段落です。
これからしばらくは、医療・介護経営に専念?する予定です。

以上です。では、また明日(^-^)v

(当該内容は、私の所属する組織とは一切関係はなく、全ての文責は私個人に属します。)

テーマについて、ご要望あれば、コメントをどうぞ。

◇病院経営の見える化について公開講座(動画)の講師をする機会を頂きました。感謝(^_^)
https://hcmi-s.net/weblesson-hcm/jmp_consult_01/  (講座)
https://healthcare-mgt.com/article/iryo/jmp_consulting01/  (紹介)

◇過去の内容、記事はこちらから是非(^-^)
https://wakuwaku-kokoro.net/

◇試験勉強や本の学びをアウトプットしているYouTubeチャンネルは、こちらです(^-^)
https://youtube.com/channel/UC_PiglYG9qTBjlJ3jt3161A

この記事を書いたのは、こんな人。
ーーーーーーーーーーーーーーー
地方の中小病院に勤務する医事課畑出身の企画部門所属にする医療経営士2級。
名は、中神勇輝。2023年、医療経営士1級を受験予定。
(可能なら中小企業診断士も受験する予定。)
趣味は、ドラムと家庭菜園と筋トレ(HIIT最高!)と読書。