こんにちは、Sansan DSOC 研究開発員の齋藤(@sinchir0)です。
3/2(火) 19:00 -21:00にて分析コンペ勉強会を開催させて頂きました。
今回は本勉強会のレポートを書かせて頂きます!
開催する背景は?
何かしらの勉強会を開こう!というお話を社内で頂いたので、僕が好きな分析コンペを主題にした勉強会として推進させてもらいました。 仕事でも分析コンペ関連のことができるのは幸せの一言です😊
登壇者は?
私の方からお声がけさせて頂き、
- Hidehisa Arai (@kaggle_araisan) さん
- カレーちゃん (@currypurin) さん
- pao (@pppaaaooo) さん
の豪華3名に登壇頂きました。 快諾頂き本当にありがとうございます🙇♂️
またSansanからは、研究員 黒木(@kur0cky_y)が登壇しました。手伝ってくれてありがとうございます!本当に助かりました!
参加者は?
当日の参加者数は550名となりました。 大変多くの方に参加頂けました。
アンケート結果は?
82%の人から非常に満足という高評価を頂きました。
また、コメントからWordCloudを作成してみました。
ポジティブな意見を多く頂けて嬉しい限りです。もちろん反省点もありますので、次回以降にしっかり反映させていきます。
発表内容
脱! Deepでポン ハイパラチューニング芸人を卒業するために / Hidehisa Arai (@kaggle_araisan) さん
分析コンペでの問題を、理解・分解・置換の3つに分解することで、コンペ毎の課題に即した対策の導き方を説明頂いています。 課題を分解して対策可能な課題へと変換する考え方は、上位入賞を目指す上で重要な考え方だと感じました。私も明日から実践していきます💪
分析コンペの開催と運営について / DSOC研究員 黒木(@kur0cky_y)さん
Sansan株式会社は、2020年10月にatma株式会社と共同でatmacup#6を開催させて頂きました。その中での進め方、具体的にどんなことを行ったか、苦労した点などの発表となります。コンペを開催しなければ知り得ない裏側を分かりやすく説明頂き、コンペに参加できることへの感謝の気持ちを強く持とうと思いました。
Colaboratoryで分析コンペをするときのテクニック集 / カレーちゃん (@currypurin) さん
Google Colaboratoryで分析コンペに挑む際のテクニックがこれでもかと詰め込まれた発表です。 分析コンペ×Colaboratoryの観点では、実践的な情報が最も多く詰まっていると思います。 環境判別コード、データセットへのuploadのコードは私も利用させてもらっています🙇♂️
Noisy label 対抗記 ~Cassava Leaf Disease Classification~ / DSOC研究員 齋藤(@sinchir0)
Cassavaの概要とNoisy labelへの対抗の仕方について、私から発表させて頂きました。 Twitterやコメントから、Noisy label対策の一つであるConfidentLeaningに興味を持ってくださった方が多いようで発表した側も嬉しいです😊
短期間コンペの戦い方 / pao (@pppaaaooo) さん
短期コンペと長期コンペの違いを明確にしながら、主に短期コンペでの戦い方を発表して頂きました。 atmacupで何度も優勝を重ねている方の思考法、極めて貴重だと感じます・・・! アイディアの数や、予測効果が本当に効果的かどうかは、自身のコンペ経験やどれほど深く理解できているかに依存すると感じました。これからも精進します。
懇親会
試験的にClubhouseにて懇親会を行いました!
Listenerの方に挙手をして頂き、Speakerとして直接登壇者の方と会話して頂く形式をとってみました。 登壇者の方の回答が聞いている全員に共有される点は良いなと感じています。
一方、Clubhouseの利用者がios+招待がある方に限定されてしまうこと、登壇者の方と聴講者の方の会話のハードルが少し高いのが問題と考えており、 今後より良い方法を考えていきたいと思います。
最後に
登壇者の方はもちろん、聞きにきてくれた方、Twitterで盛り上げてくれた方、質問をして下さった方、多くのサポートをしてくれたSansan内の方、全員に心から感謝しています。 本当にありがとうございました!!