2020-01-01から1年間の記事一覧

kaggle tweet コンペの闇と光 (コンペ概要と上位解法)

概要 先日 to be twitter masters というチーム名で Tweet Sentiment Extraction コンペ (以下 tweet コンペ) に参加したので、まとめに記事を書いておきます。チームメンバーは筆者と @fuz_qwa @Kenmatsu4 @tkm2261 @yiemon773 の 5 人で、結果は 5 位とな…

【rustdef】Rust on Jupyter Notebook で各種統計分布を生成する

はじめに どうも、最近 Rust を勉強し始めた ぐちお@ihcgT_Ykchi です。 Rust を勉強しだしたのは、huggingface の tokenizer のように、python でコードを書く際にピンポイントで高速化できると良さそうと思ったのが一つですが、正直なところ単に春だし新し…

Matthews Correlation Coefficient (MCC) について勉強した

本記事の概要 最近 Google AI Blog で紹介された ELECTRA の論文 を読んだのですが、論文内に出てきた Matthews Correlation Coefficient (MCC) をそういえばわかってないなぁと思ったのでまとめておきます。 調べてみると使える場面は多そうで、kaggle でも…

Google QUEST Q&A Labeling の反省文

本記事の概要 kaggle の NLP コンペである Google QUEST Q&A Labeling に参加し、その社内反省会を主催したので、その時の資料をブログに落としておきます。筆者は 1,571 チーム中 19 位でした。 shake 力たりんかったか... pic.twitter.com/L4bJGp5oil— ぐ…