159 Google Open Source Expert Prize とか 予算あり機械学習コンペ とか
Posted: February 07, 2022
Google Open Source Expert Prize 1月分
次の3個のノートブックが受賞 https://www.kaggle.com/general/304323
- SETI-BL: TF Starter TPU https://www.kaggle.com/awsaf49/seti-bl-tf-starter-tpu
- SETI データを使用
- TPU を利用したスターターキット
- [TF.Keras]: Learning to Resize Image for ViT Model https://www.kaggle.com/ipythonx/tf-keras-learning-to-resize-image-for-vit-model
- Petfinder データを使用
- resizer を利用して Vision Transformer での画像を扱いやすくする
- Building models in JAX - Part1 (Stax) https://www.kaggle.com/aakashnain/building-models-in-jax-part1-stax/
- JAX を利用したノートブック
Honorable mentions(佳作?)
- TicTacToe for Beginners https://www.kaggle.com/akash0/tictactoe-for-beginners/
- TicTacToeコンペのチュートリアル
- Tensor flowと使ったQ-learning
2月の目標
- れごん
- Twitter禁止・モスバーガー禁止
- 記事の執筆依頼が2~3本位きているので片付ける
- 確定申告を片付ける
- dydxという分散型取引所でBOTを動かす
- Kaggle は Ubiquant Market Prediction
- カレー
- kaggle:feecback prizeとUbiquant金メダル圏内に入る
- Numerai:signalsでcvを0.035に到達
- Youtube:動画を毎週出す
- ストレッチ:床まで15cmに到達
今週の分析コンペ
- AI BlitzFaces
- AIcrowd の AI Blitz という複数のタスクの総合評価を競うコンペ
- 今回はすべて顔に関連するタスク

AIcrowd | AI Blitz XIII | Challenges
https://www.aicrowd.com/challenges/ai-blitz-xiii
- Data Purchasing Challenge 2022
- 本番運用を想定したコンペ
- マルチラベリング金属板損傷の分類画像コンペ
- 3つのフェーズに分かれる
- Pre-Training Phase
- 5000枚の画像のラベリングされた画像を利用
- Purchase Phase
- 10000枚の未ラベリング画像にアクセスできる
- 予算が3000枚のみ選択してラベリング情報を購入できる
- Prediction Phase
- テストデータセットから評価用の予測を行う
- Pre-Training Phase
- 実際の運用ではラベリングできる量も限られているので、どういったデータをラベリングしていくと効率的に精度をあげられるかを考える必要がある。Data-Centric の考えにも近い。

AIcrowd | Data Purchasing Challenge 2022 | Challenges
https://www.aicrowd.com/challenges/data-purchasing-challenge-2022
- NBME - Score Clinical Patient Notes
Kaggleの新コンペ
— カレーちゃん🍮 (@currypurin) February 2, 2022
医師国家試験のカルテをとる答案の表現と重要概念の関連付け
・5/4まで
・コードコンペ
・自然言語https://t.co/rNnVXRfwvw
- Happywhale - Whale and Dolphin Identification
Kaggleの新コンペhttps://t.co/GqEAsQscBN
— カレーちゃん🍮 (@currypurin) February 2, 2022
クジラやイルカの個体識別
・4/19まで
・コードコンペではない
・画像
・データサイズ62GB
- Zindi
- アフリカのデータサイエンスコミュニティ?
Zindiのコンペhttps://t.co/DjNfpsKjYH
— カレーちゃん🍮 (@currypurin) February 2, 2022
海亀の個体識別。
3/13まで、データサイズも6Gとそれほど大きくないので、そこそこ取り組みやすいかもしれない
雑談・来週話したいこと
2/18(金)に「KaggleMasterカレーちゃんが語る Kaggle入門とキャリア」というお題で話すことになりました。
— カレーちゃん🍮 (@currypurin) February 2, 2022
kaggle入門はいつも発信していること、キャリアは自分の過去の就職活動とか最近感じていることなどを話す予定です。
参加お待ちしています。 https://t.co/vcBCl7JmQm