Regonn&Curry.fm

174 PLATEAU LT会 とか 電笑戦モデル とか

Posted: May 23, 2022

お題

PLATEAU LT 01

  • 登壇予定だけど、登壇者も抽選のため6月21日まで発表できるかわからない
3D都市モデル PLATEAU LT 01 (2022/06/24 19:00〜)

https://asciistartup.connpass.com/event/247073/

電笑戦モデル

5/25のAWSサミットで開発される電笑戦。カレーちゃんとして、参加する

多数のボケと、評価データが公開されており、とてもすごいデータセットだった。

ボケAI2つと、評価AIを作った。

ボケAI

イメージキャプショニングで画像をテキストにしか、GPT2&テキスト類似検索でボケを生成。

マスクしてその箇所を予測する方法で、文章をきれいにする

評価AI

ターゲット3つのマルチタスク学習

エンゲージメント、シュールさ面白さを予測

100件程度、ハンドラベリングした

今週の分析コンペ

雑談・来週話したいこと

以下ボーナス・トラック

たかじゅん

今までLGBMのみでsubmitしていましたが、スタッキングで1段目(LGBM、XGBoost、CatBoost)でやり始めようとしています。勉強不足だったのですが、XGBoostではカテゴリー変数が扱えないことを知りました。このような状況でカレーちゃんだったらどうしますか? 1)LGBM、XGBoost、CatBoostはそのまま採用で特徴量を工夫する(Feature hashing等) 2)XGBoostの使用をやめる カレーちゃん、恋言さんだったらどう考えるのか知りたいです。

カテゴリ変数を扱えないからといって精度が出ないということもなく、カウントエンコーディングとか、targetエンコーディングとかで、XGBoostでも精度が出ることが多そう。 LightGBMでもtargetエンコーディングがkeyになるコンペもあるし

アメリカ ユタ州 ぞうさん

少し遅くなりましたが、カレーさんKaggle Grandmasterおめでとうございますb。ずっと目標に向かって頑張ってきて、そしてその目標を達成して本当に素晴らしいです。MBMEコンペ一位、すごいですね。おめでとうございます。これからも応援しています。ユーチューブの更新も楽しみにしています。 私は最近AIの勉強を始めましてKaggleはまだ少しさわった程度です。でも今後Kaggleを使って勉強していきたいので、このポッドキャストは、とてもためになります。それから二週間前に、"The Kaggle Book"を最近購入しました。私のようにKaggleのことをあまり知らない人にはとてもよい本だと思いました。bただ、本を購入したのですがリンクがたくさんあるので、Kindleで買えばよかったかなと思いました。本の中にRegonnさんの"Is he Kerneler" twitterアカウントの記載があるのも発見しました。 これからどんどん暑くなりますので、お二人ともお体にお気をつけてお過ごしください。毎週ポッドキャスト、楽しみにしております。b