データサイエンス入門講座

4
記事

第19回 ズルのできない予測精度の検証方法(2)

過学習を見抜くためのフェアな評価方法 過学習がなぜ問題になるかというと、今あるデータに対...

第8回 アウトカムを設定するコツ(2)

そのアウトカムでズルはできるか 前回示したように、まずは利益に直結するか、ということを考...

第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ

データ整備のサグラダファミリア ここまで「業務のためのデータ」をどう「活用のためのデータ...

第4回 抜け漏れ・異常値・表記の揺れにどう対処するか

数値化や再分類を阻む「データの汚れ」 前節では日付やフリーワード、「あまりに細かすぎる区...