過去、オフラインでのコンペ開催を重ねてきたPeakersが主催する初のオンラインコンペティションです。
本コンペでは、機械学習を学び始めたばかり・自然言語処理(NLP)は初めて、といったご自分のスキルに不安のある方にもチャレンジしていただけるよう、本課題のためのチュートリアルをご用意しています。こちらを読み込んで課題に取り組んでいけば、独学以上の大きな成長ができるチャンス。コンペでスコアを伸ばしていく難しさや楽しさも味わえます。
すでに熟練という方は、全国のライバルたちの中でご自身の実力を試せる機会です。これまでPeakersのオフラインコンペに参加してきた多数の猛者たちが集まることが予想されます。是非、トップを狙いに行ってください!
Peakersとしても新たな取り組みとなる今回のオンラインコンペ。ベータ版としての開催ではありますが、オフラインと変わらない楽しさをお届けできるよう準備を進めております。学生限定での開催ですので、社会人の方や世界中の人が参加するコンペでは敷居が高いと感じている方も是非挑戦してください!
初学者・熟練者を問わず、多くのご参加をお待ちしております。
昨今、報道のソースがツイッターであることが増えました。ニュース番組などでも、災害や事件、事故の動画に「視聴者による撮影」のような注釈が付いていることも多く見受けられます。その多くはユーザーがツイートしたものに対し、テレビ局がDMなどで動画利用の許諾を取っています。今やニュースの「速報性」ではツイッターに勝るものはない、と言えるでしょう。
しかし、ツイートをベースに災害や事故を報道化するには、まだまだ課題もあります。それは、機械的に特定キーワードを拾ってきても、それが災害や事故に関するものかどうか、判断が難しいためです。例えば、下記のツイートをご覧ください。
このツイートでは「燃えている」というキーワードに、画像が添付されていますが、もちろん火事のツイートをしている訳ではありません。人間が見ればすぐにわかる内容でも、機械にとっては明確な判断が難しい内容です。
このコンペティションでは、実際に災害に関するツイートと、そうではないツイートのデータを用いて、ツイートが災害に関するものかどうかを予測する機械学習モデルの構築にチャレンジします。
また、データセットはツイートデータ1万数千件ほどで、お手持ちのPCのスペックだけで十分解析に取り組めるサイズになっています。
課題への基本的な取り組み方については、今回の課題専用のチュートリアルを用意しております。
また、参加者同士で情報交換ができるSlackの質問スレッドも準備いたしますので、ぜひ活発な交流をお願いいたします。
技術的な不明点等については、Peakersからデータサイエンティストが可能な限り、随時サポートを行う予定です。
上位入賞者には自然言語処理の専門家からコードレビューの機会なども提供される予定です。
その後、コードレビューや表彰なども行う予定です。ぜひご参加ください。
参画・登壇企業 SPONSORED BY