データ分析のための前処理アプローチと Python ツール


PyData.Tokyo Meetup #10」の発表資料です。

データ分析では前処理が大事だという話はよく聞きますが、具体的に実務で何をやるのかというレベルでの話はあまりないので、割と新鮮な話なのではないかと思います。細かいレベルではもっといろいろと書きたいことはあるのですが、発表の枠組みの中である程度網羅させるという意図でまとめています。

データ分析を行う上で、データハンドリングがうまくないとか、理論は知っているけど適用することができないとか、そういう悩みを抱えている初心者データ分析者の方は、一度目を通すと良いのではないかと思います。