募集内容 |
参加枠1 無料
参加者数
|
---|---|
申込者 | 申込者一覧を見る |
開催日時 |
2021/08/22(日) 19:00 ~ 21:00
|
募集期間 |
2021/07/31(土) 13:56
〜 |
会場 |
(場所未定) |
イベントの説明
【無料】ゼロからはじめる機械学習講座「Kaggleに挑戦」
Numpy,Pandasライブラリを使って機械学習のデータ処理を体験し、線形回帰の問題を解いていきます。 ラストは学んだことを活かして、Kaggleに挑戦してみましょう。
録画授業です。定時にテキストと動画URLを配信いたします。
対象者
エンジニア歴数年以上の方。 プログラミング初心者は「ゼロからはじめるパイソン入門講座」をオススメします。
ご用意いただくもの
・ノートPC持参 ・言語はPythonを使います。
今回学ぶこと
・numpyライブラリ ・matplotlibライブラリ ・ヒストグラム ・データフレーム ・データ分析 ・要約統計量を表示する ・単回帰分析 ・散布図の上に計算した回帰係数と切片が示す直線を上書き表示 ・モデルの決定係数 ・Kaggle にチャレンジ
Kaggleはデータサイエンティストへの最速の近道。そして一攫千金も。
Kaggle(カグル)は企業や研究者がデータを投稿し、それに対して、統計家やデータ分析家がその最適モデルを競い合う、予測モデリング・分析手法のプラットフォームで、2010年に設立。そして2017年にはGoogleが数百億円で買収しました。
100万人以上のカグラーが一攫千金を求めてカグルに登録
カグルの仕組みは、企業や政府などの組織がコンペを開催、それに対して、データサイエンティストや機械学習エンジニアが最適モデルを提案。賞金と引き換えに最も制度の高い分析モデルを買い取るという「クラウドファンディング」の仕組みです。
現在、開催されいるコンペを見てみると、賞金は250万円から1000万円ぐらいまでのコンペがひしめいていますが、3億円の賞金のコンペもあったようです。
https://www.kaggle.com/competitions
コンペの分野はさまざまで、HIV研究、チェス格付け、交通量予測、空港のセキュリティなどなど。 日本企業の例ですと、メルカリが販売者が投稿した情報を基に「適正な販売価格」を予測するチャレンジを開催しました。
Kaggleの中でも特に有名な課題として「タイタニック号:災害からの機械学習)」があります。
なお、コンペ参加費用は無料で、企業から提供されているトレーニング用のデータセットを利用して、モデルの訓練を行います。
チャンスは1日5回。リアルタイムで評価スコアがわかる!!
各データセットには、他のユーザーが構築した予測モデルのコードや説明が公開されています。 それは「Kernels(カーネル)」という機能で閲覧できます。
また、「Discussion(ディスカッション)」はカグラーたちのコミュニティ機能で、そこで質問したり、情報交換をすることができます。
データの投稿は、予測されたデータのファイル(CSV形式)だけのときや、モデルのコードのカーネルの提出が必要な時があります。
予測データの投稿後は、リアルタイムで評価がつきます。 このスコアをあげていき、コンペを勝ちあがりましょうということになります。 なお、予測データの投稿は1日5回までです。
初心者の方でもカーネルで公開されている処理コードを読むことで、最先端のデータサイエンティストに近くことができますので、Kaggleは機械学習の勉強の場としても有意義です。
爆速でデータサイエンティストになるためにはKaggleが近道
Kaggleをやることでデータサイエンティストになるために必要なスキルを身に付けることができます。
データサイエンティストになるには、機械学習の理論や数学・統計に関する学習、データを見極めたり、モデルを作成する作業、そしてコーディングスキルが必要とされています。
しかしながら、Kaggleを始めるだけならそれは不要で、プログラミング言語を始めるのと同じ感覚で、他のカグラーの分析手法を見ていれば、自ずと上記のスキルが身につくようです。
プログラミング経験がない人でも、カグルをやって3ヶ月で「ソロゴールド」という称号を得た人もいます。
機械学習の勉強歴が半年の初心者で、Kaggleで銅メダルを取得した方のブログによると、注目した視点は、入力データを改変する“前処理”と、他者が提案したモデルを良いとこ取りする“モデルの流用”とのことです。
これを読む限りでも、カグラー同士でマッシュアップされていく世界観が彷彿とされており、カグルの最大の魅力といえましょう。
資料 資料をもっと見る/編集する
資料が投稿されると、最新の3件が表示されます。