シティズンデータサイエンスラボ

「データサイエンスをみんなの手に。」を目標に掲げるデータビークルのオウンドメディア。「シティズンデータサイエンス」とは、統計学の専門家ではない一般の人々が、ツールを活用して手軽にデータを活用すること。豊富な実践事例や読み物で、データ分析の世界をより身近なものにします。

第4回 抜け漏れ・異常値・表記の揺れにどう対処するか

数値化や再分類を阻む「データの汚れ」 前節では日付やフリーワード、「あまりに細かすぎる区分をするID」などは、数値化や再分類といった加工をすれば「活用のためのデー...

第3回 数値化と再分類でデータをもっとリッチに

活用できるデータの項目 前節では「顧客ごと」「レシート1行ごと」という粒度の異なる形式のデータを結合し、集計することで「活用のためのデータ」に加工する考え方を学...