バリスタになりたい。

バリスタになりたいエンジニアがコーヒーとPythonに関する情報を発信したりします。

kaggleのハンズオンに参加した話。

どうも、makaloniです。
これから梅雨の季節ということで天パがこわいっす。
 
先日、サポーターズさん主催のkaggleのハンズオンセミナーに参加しました。
オンラインでトイプロブレムを扱いながらkaggleの流れをさらっていくという内容です。
 

kaggleってなに?

kaggleは機械学習のコミュニティです。
特徴としてはコンペを行なっているという点が挙げられます。
 

 

f:id:makaloni:20190609182458p:plain

コンペの例
こんなかんじで、「企業などが出したお題に対してモデルを提案」→「良い成績を獲得できればそれを買ってもらえる」という形になっています。
 
といっても初心者にも優しい設計で、カーネルというプログラムの雛形が大体あってそれを編集していくことでモデル構築をしていく流れになっています。
一から環境設定をしなくていいことため、とても取り組みやすいですね。
 
Facebookのアカウントがあればサインインできます。
基本英語でサポートされたサイトなので、英語が苦手な人は若干使いにくいかもしれないです。
 

ハンズオンの内容

オンラインハンズオンはYoutubeで再生されているのを見る形式です。
こういう形式だと会社が終わって家でご飯食べながら見れたりしていいですよね。
 
ハンズオンでは、「タイタニック」に取り組みました。
タイタニック号の乗客のデータが与えられて、学習モデルを作成します。
そのあと、未知のデータに対して正しくその乗客の生死が予測できるのかという問題です。
 
と、まあ、結構倫理観に訴えてくる問題。
 
今回は登壇者の方が作成したカーネルを元にデータを処理して、モデルを作成、精度評価という流れになりました。
(実際はポチポチ画面のボタンを押してるだけです。)
 
乗客のパラメータ(年齢、性別、乗船場所のランクなど)を元にデータを可視化してどのデータが影響度の大きいデータなのか探りながらモデルを作成しました。
 

ハンズオンに参加してみて

「ロジックはわかるものの、どうやってデータを処理していいかわからない。」
ということはよくあるかと思います。
もしくは、
「どうやってデータを処理するのが効率がいいのかわからない。」
などですかね。
僕もまだまだ初心者ですが、もっと始めたばかりの時によく悩んだ覚えがあります。
 
そういったことを先人の思考を追いながらコードを弄れるのはとても勉強になるなと感じました。
 
今後も勉強を兼ねて、定期的にkaggleに参加していきたいと思います。
 
最後まで読んでいただきありがとうございました!