筋金入りの文系女子大生が「データサイエンス入門講座」を受講してみたら
今回はシティズンデータサイエンスラボ超特別編としてデータビークルの「データサイエンス入門講座」に参加してくれた女子大生きなこちゃんのレポートを掲載します。自称「筋金入りの文系女子大生」きなこちゃん、2日間で徹底的に統計学の基礎を学べる講座でどんな感想を抱いたのでしょうか…!?
シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。
物理で0点を取った私に統計学が理解できるのか!?
シティズンデータサイエンスラボをご覧のみなさま、こんにちははじめまして!某私立大学の文系学部に通う女子大生、きなこといいます。
ハムスターみたいな名前ですがペンネームです。
タピオカミルクティーも好きです。女子大生なので。
さて、統計学やデータサイエンスとは全く無縁の人生を歩んできた私が、なぜこの度データビークルさんのオウンドメディア「シティズンデータサイエンスラボ」に寄稿させていただくことになったのか!?
それはデータビークルの油野社長から、「データサイエンス入門講座」に潜入し、文系女子大生の目線でレポートを書けという指令が私に下ったからであります。
私は現在大学3年生でまもなく就職活動がスタートするのですが、
「データを使った論理的なマーケティングに興味があって、将来そういう職に就きたいとは思うものの、文系学生にデータや統計なんかわかるのか不安…」
という私の悩みと、
「統計学は難しいというイメージを払拭したい!」
というデータビークルの油野社長の考えが、ばっちーん☆とマッチし「受講料値引きするからオウンドメディアの記事書けや」という取引が成立したため、本稿を寄稿することに相成ったわけです。
しかし、お恥ずかしながらわたくし、中学3年生の頃から数学の授業についていけなくなり、忘れもしない高校1年生の物理のテストでは計算ができず0点をとった、筋金入りの「文系」であります…。
果たしてビジネスマン向けの数学・統計学教室についていけるのでしょうか??
データビークルさんのオウンドメディアへの寄稿ではありますが、わからないことはわからないと言うし、なんならそんなに簡単に統計学を理解してたまるか!という気持ちで受講して参ります!
長い前置きとなりましたが果たして文系大学生に統計学は理解できたのでしょうか?最後までぜひお読みください!!
まずは数学というより算数の勉強からスタート
2019年8月8日、猛暑のなか、品川駅から徒歩5分、本気ダッシュで3分くらいのところにある会場に向かいました。
講座は2日間で4パートに分かれています。今回の受講者は男性が4名女性が4名です。
まずは、笑顔が優しそうな細身の男の先生が、「最小値」「最大値」「中央値」「平均値」についての解説をスタート。数学というより算数の基礎ですね。
ここで数字の書いてある札が配られました。
2人1組になって、この札を並び替えたり、分類したり、計算したりします。
ちなみに配られている札の数字がグループごとにちがうのでカンニングはできません!(まぁ、誰もしてないんですけど…)。
口頭で言われた数字を、紙に書いて計算するのと同じなんですが、こういう風に実体化しているものを並べ替えるとなぜかわかりやすいですよね。
ちなみにここまでの作業で使えるのは電卓のみです。エクセルがインストールされているパソコンを持参してくることになっていますが、ここまでは手作業の世界。
そんなわけで電卓でちまちま計算してきたわけですが、もしこの札、実際のデータのように100枚、1,000枚あったらどーするの?
平均ひとつだすのも一日中電卓をぽちぽちしないといけなくて大変ですね。私は嫌ですめんどくさすぎ!!
エクセル様のありがたみを感じずにはいられません。
はじめましてのエクセル関数「ttest」
引き続き、「25%点」、「75%点」の説明、そして標準偏差について解説が入ります。
ここで計算についていけなくなりそうな気配を察知した私は、慌ててホワイトボードの写真を盗撮(写真上)。
さらにパソコンの陰に隠れてスマホで「ルート 外し方」で検索しつつ、なんとかついていきました。
「データには量的なものと質的なものの二種類あるんだよー」というはなしで1時限目は終わり。最後にテストをしました。
コマの終わりごとにテストがありますがテストいやいやマンな私でも大丈夫。だって、わからなければすぐに先生に質問できるから。
少し休憩をはさみ、2限目がスタート。統計的仮説検定のおはなしです。ここからはがっつりエクセルを使っていきます。
計算で出たそのデータたまたまじゃないの!?
ほんとにぃ~!?
ってのを解決していきます。
いかんせん座学ですので1枚目の写真と構図がかわらないのですが、みんなガリガリ作業していきます。
「ttest」とかいう人生においてはじめましてのエクセル関数(t検定を行うための関数です)のおはなしに振り落とされそうになりつつも、なんとか1日目が終了しました…。
エクセルに値を入力して数字が変わるのは楽しい!
2日目の授業は朝10時から始まりました。
怠惰を極めた大学生にとってはつらい早起きでしたが無事会場に到着。2日目は夕方まで頑張ります。
2日目の午前は回帰分析、重回帰分析の勉強です。
「切片」と「傾き」をぽちぽちとエクセルに実際に入力してみると、変わる数値が楽しいです。
というか、知らない機能がいっぱい。ただ表を作ったり計算するどころか、データ分析までできちゃうんですね。エクセルかしこい(小並感)。
お察しの通り学生の私はエクセルの作業に慣れておらず、置いて行かれそうになりつつも必死にしがみついてなんとか午前の講義が終了。
品川おしゃれランチで疲れた脳を回復したところで、最後は「ロジスティック回帰分析」をお勉強します。
本講座のラスボスです…!!
「オッズ」「対数」「最尤法」などチョットワカラナイデスネ~、な単語が登場しまくるものの、先生がわかりやすく競馬のたとえでオッズ比を解説してくれたこともあり、なんとかついていけました。
昨日今日とここまで、ロジスティック回帰分析を理解すべくやってきたわけですが、難易度鬼でした…!
駆け抜け、最後にテストをといて終了。
2日間でロジスティック回帰までということでかなり駆け足の内容でした。
…ぜえぜえ。
ちなみに私は最後のコマの途中から完全において行かれてしまいましたが、授業後、先生に質問したところ、さかのぼって丁寧に教えていただきました。少人数制なので質問をゆっくりできるのは助かります。
実践的に統計学に触れられる貴重な機会でした
かなり密度が濃い2日間でしたが、統計学について実践的に触れることができた貴重な体験でした。
これまで私は統計について「数値で判断すること」程度の漠然とした認識しかありませんでした。
ですが、今回の講座を受講して一口で「統計的にみる」と言っても、数には「質的な数」と「量的な数」があるということや、それぞれで使われ方が違うということなどを知り、経験則で物事を判断するのではなく、統計的に考えることの重要性を感じました。
今回の受講を通じてデータで見るマーケティングにさらに興味がわいたので、これからもさらに勉強していきたいと思います。
最後までお読みいただきありがとうございました!
ちなみに体感10年分の数学に触れ、あたまの普段使わないところを使って非常に疲れたので、私はこのあとめちゃくちゃ寝ました。
<おしまい>