シティズンデータサイエンスラボ

「データサイエンスをみんなの手に。」を目標に掲げるデータビークルのオウンドメディア。「シティズンデータサイエンス」とは、統計学の専門家ではない一般の人々が、ツールを活用して手軽にデータを活用すること。豊富な実践事例や読み物で、データ分析の世界をより身近なものにします。

第19回 ズルのできない予測精度の検証方法(2)

過学習を見抜くためのフェアな評価方法 過学習がなぜ問題になるかというと、今あるデータに対してもっとも予測値と実際の値のズレが小さくなるように計算した状態で、その...

第18回 ズルのできない予測精度の検証方法(1)

「精度100%の予測」といわれたら、まず疑うべきこと 適切な課題を設定できれば、予測モデルもAIも開発できるようになります。ここまでの具体化ができていれば、統計解析や...

第17回 AI開発における適切な課題設定とは(2)

総負荷量とトレードオフになる安定性と有効性 このように総負荷量という考え方を持って「どれだけの煩わしさを解決できるか」「もっと範囲を広げて考えられないか」という...

「世界で戦う拡張アナリティクス」をテーマに「Tokyo Data Science Lab 2019-20」を開催します!(2019年12月6日)

こんにちは。データビークル広報担当です! 昨年データビークルでは「Tokyo Data Science Lab 2018」と銘打ちはじめてのプライベートイベントを開催しました。おかげさま...

第16回 AI開発における適切な課題設定とは(1)

省力化に着目したAIの課題設定 「予測精度の改善価値」にフォーカスする予測モデルについては「現状の1.05倍の精度で予測してどの程度のコスト削減効果があるか」と考えれ...

第15回 何をデータで予測させるべきか(2)

前回の記事はこちら 1.05倍の予測精度の向上価値 なぜ「感覚的に1.05倍」か、という点について説明しておきましょう。おおむね現在行っている経験や勘による意思決定から...