みなさん、こんにちは
ABEJAでデータサイエンティストをしている服部です。
今回は2023年10月20日に行われた、関西Kaggler会のイベントにスポンサーとして参加し登壇・聴講したため、その参加報告を記載いたします。
関西Kaggler会について
最初は関西にいる数名のKagglerで集まろうというところから始まったみたいです。 それが今となっては公式サイトも存在し、100人近い参加者が集まるイベントになったみたいです。
前回のイベントについてはこちらで記事になっています。
今回のイベント
今回は第3回のイベントでした。 14:00-18:30での開催で、全部で11名のLTが行われました。
イベント会場
グランフロント大阪にあるアールスリーインスティテュート様の「gusuku Ashibinaa OSAKA」というワークスペースで行われました。 とてもオシャレな会場でした!
イベント用コンペ
今回のイベントを盛り上がるにあたり事前に一週間程度のコンペも行われました。 このコンペの話題で参加者同士の会話が弾めば嬉しいというお気持ちみたいです。 何名かのKagglerのベースラインを超えると、賞品をもらえるみたいな盛り上げ要素もありました。
コンペのお題は、関西地方の物件の取引価格予測で、学習データは大阪以外、評価データは大阪府というちょっと変わった、かつ関西にちなんだコンペでした。
私も参加しましたが惜しくも、豪華家電(?)の抽選権のラインをギリギリ越えれませんでした。悔しい!
スポンサーとして参加
今回私はABEJAとしてスポンサー枠で参加しました。
スポンサーとして参加させていただいたのは、データサイエンス・機械学習を取り扱う会社としてKaggleのコミュニティを支援し、お互いにナレッジを共有し高めあえる機会を創出したいという想いと、Kagglerの皆さんにABEJAを知っていただきたいという気持ちからです。 特に私自身はKaggleのコミュニティから多くの還元を受けてきて、それがABEJAに入るときやその後の業務でも大きく活きていると感じています。 今後もこういったKaggleと企業での仕事両方がうまくつながるために様々な貢献をしていければよいと思っています。
スポンサーとしてのLTではKaggleと実務に関して「Kagglerのどんなところが実務の中で役立っているのか」「Kagglerの安心感」などの話と最後に会社紹介・採用情報の話をしました。
発表
たいちさん @HomesickTic:自作キーボード講座
Kagglerにはキーボード大事。ということで初心者にも分かりやすい自作キーボードの世界を紹介してくれてました。 実際に自身の作成した自身のキーボードをいくつか持ってきて、参加者に触ってもらうこともしていました。
ころんびあさん @colum2131:コンペで勝つには/CVPRのWorkshopコンペ参戦記
「コンペで勝つにはどうしたらいいか?」という深い話題かと思いきや、途中からCVPRのWorkshopで開催されている自動運転関係のコンペでのタスクや解法の紹介をいただきました。 Kaggleではあまり馴染みのないタスクの紹介や、BEVやPETRなどの技術についてなど勉強になりました。
T88さん @take213:忙しくて手を動かせない時もいい感じに進捗出してくれるAgent作りたい
忙しくてKaggleやる時間がないよね。それならばLLM使ったAgentに実装をしてもらえばよいのでは?というアイデアを試してみた発表でした。
- 勝手にtargetを特徴量に使ってリークさせるようなケースもあった
- 80個のアイデアを実行して33個のアイデアがCV向上しており結構便利
など実際に実装してみて分かる話も多く、面白かったです。
ろんさん @mipypf:時間のないKagglerのすすめ
子育て and 社会人博士取得中のろんさん。時間がない中でKaggleをどうやるかの話です。
スマホでKaggleをする、アイデアメモ、隙間時間でのKaggle実施、RedBullとChillOut交互に飲むといった具体の対策についていくつか発表がありました。 私も時間がとれない身なので、とても共感できることが多かったです。
Jackさん @sakata_ryuji:Feature ImportanceをCVでやるとリークする話
Kaggle界隈のTwitterで一時期話題になっていたトピックを丁寧に教えてくださりました。 実際に疑似データを実験をしながら、CV全体で特徴量選択するとリークすることとその理由の話、そしてPermutation Importanceについてもリークをどう考えるかの解説もありました。 テーブルデータ勢には必見の内容かと思います。
くるぴーさん @kurupical:LLMコンペで考えていたこと
最近Kaggleで開催されたLLM Science Examコンペでソロ金メダルを取り、ついにGrandMasterになったくるぴーさんの発表。
コンペでの自身の思考やアプローチについて解説してくれました。 個人的には、「思考を止めない(GPU動かすだけの実験をしない、それなら休む)」という考え方は個人的にも参考にしていきたいなと思いました。
Yuya Yamamotoさん @nejumi_dqx:コミュニティコンペの継続開催
過去に多くのコミュニティコンペを開催している山本さんのコンペ開催する側に関する発表です。 コミュニティコンペとはKaggleの機能で自分たちでコンペを開催できるというもので、ハッカソンのような使い道やコミュニティ内で楽しむために使えます。 今回の関西Kaggler会用のコンペも山本さんがコミュニティコンペとして作ったものです。
特に、複数回参加する人が前回の学びを活かせるようなコンペ設計をするという考え方は面白かったです。
johannyjm1さん @johannyjm1:Polarsの遅延評価
johannyjm1さんによるPolarsでの遅延評価に関してのお話でした。 Polarsは、PythonのDataFrameライブラリでpandasよりも高速・省メモリで最近話題になっています。 そんなPolarsの機能の1つである遅延評価に関しての説明と、それによりどれくらい処理が高速化されるか解説が参考になりました。
あまえびんさん @amaebin:オレオレKaggle開発環境について
あまえびんさんによる自身が開発したオレオレKaggle開発環境についてです。 Kaggleをやっているとローカル開発環境とKaggle上の環境(サブミット)の違いで苦戦することはあると思うのですが、そこを簡単に解決できる環境を作ったお話です。 githubも共有していただいております。
belugaさん @Beluuuuuuga
スポンサーLTとして、株式会社Elith の紹介と、業務に関するお話をされてました。 その場限りの話も多かったですが、面白かったです。
参加感想
発表の合間に仕事進めよう....と最初思ってたのですが、どれも内容もプレゼンも面白く、全く仕事が進みませんでした(笑)
また、今回関西Kaggler会の特徴とも言えるのかもですが、司会・進行役の方々が空気を暖めるのがとても上手く、発表中も含めて全体的にいい意味でワイワイした会でした。 直近はコロナの影響もあり、オンラインでの発表も多かったと思うのですが、オンラインにはないオフラインだからこその聴講者の反応が見えたり、発表者・聴講者とのやり取りがあり、それもとても良かったです。
また進行だけでなく、懇親会への接続や最初の写真撮影など含めて運営の方々がかなりしっかりしており、そのおかげでこの会が成り立っていることがとても良くわかりました。 改めて、運営の方々には感謝です。
最後に
また今後もKagglerとして、スポンサーとして、運営のお手伝いとして等色んな側面でコミュニティに関わっていきたいなと思います! (ただ、懇親会でGrandMasterになるまで関西Kaggler会に参加しないと宣言してしまったので早くGrandMasterになりたいと思います!)
ABEJAではゆたかな世界を、実装する仲間を募集しています。気になった方は是非ご連絡ください。