Peakers Academy

朝日新聞社・メディア研究開発センター主催、非公開データを用いた自然言語処理コンペティション

PROJECT FEATURE プロジェクトの魅力

朝日新聞社の現役データサイエンティストと課題に挑戦!

例年好評の株式会社朝日新聞社のNLPコンペティションが、本年もオンラインで開催されます。

イベントは構築したモデルの精度をスコアで競い合うコンペティション形式。
タスクの詳細は当日発表となりますが、本イベントのために貴重なクローズドデータをご準備いただいています。同社ならではの記事データや画像データを含めた、マルチモーダルなタスクとなる予定です。

自然言語処理の専門知識がない方でも、機械学習モデルの開発経験をお持ちであれば参加できる環境が整えられています。手厚いメンタリングのもと、自然言語処理に興味がある学生さんは大きく成長するチャンスです。自信のある方も、ぜひこのコンペティションで力を試してみてください。

2020年10月開催時の優秀者インタビューは下記よりご覧いただけます。
・最優秀学生インタビュー 田代真生さん

2020年2月開催時の様子は下記よりご覧いただけます。
・当日開催レポート

※上記記事は過去実施時のものであり、本イベントの課題とは異なる場合がございます。
また、本年はオンラインでの開催となります。

第一線で活躍するデータサイエンティストからアドバイスを受けるチャンス! オンラインでも大きく成長できるイベント

・充実したメンター陣
スタンフォード大学アジア太平洋研究所客員研究員も務めた田森氏をはじめ、メディア研究開発センターに所属する現役のデータサイエンティストたちがサポートを行います。

<メディア研究開発センターの直近の実績>
「メディア研究開発センター」では、膨大な記事・画像・音声データを活用した課題解決、ならびに自然言語処理・画像処理を中心とした先端技術開発に取り組んでいます。

・手厚いメンタリング体制
ワーク中はメンターが常駐し、疑問点や不明点についていつでも質問することができます。加えて、メンターとの個別の面談機会を設けており、ワークの途中経過について技術的なフィードバック(進め方についてのアドバイスや、つまずいている点の解消など)が受けられます。

・オンライン開催で全国から参加可能!
オンライン開催のため、全国から参加可能です。
参加者と競い合い、時にはナレッジを共有しながら、個人開発では味わえない成長体験ができる環境となっています。機械学習に取り組む新しい仲間をぜひ見つけてください。

・自然言語処理に挑戦
機械学習分野の中でも近年の技術革新が著しく、注目度が高い自然言語処理の課題を取り扱います。また、本年は画像処理も交えたマルチモーダルな課題となっています。
普段テーブルデータや画像での機械学習に取り組んでいて新しい分野にチャレンジしたい方にも挑戦していただけるようヒント等の準備がされています(詳細は当日発表)。
もちろん、すでに持っている自然言語処理のスキルをさらに磨きたい方にもおすすめのイベントです。

プログラム詳細

データ
朝日新聞社の記事や関連する画像データ等のクローズドデータを提供予定

課題
予測精度スコアを競うコンペティション形式、課題詳細は当日発表

開発環境
Google Colaboratoryのみ
※利用にはGoogleアカウントが必要です。
お持ちでない方は事前に発行をお願いいたします。

プログラミング言語
Python推奨、R等他言語でも参加可
※メンタリング・サポートはPythonのみとなります。
※Python以外の言語を使用される方は、使用されたい言語がGoogle Colaboratory環境にて利用できることを事前にご確認の上、お申し込みください。

こんな方におすすめ

  • Python、R等での機械学習の開発経験がある人
  • データサイエンティストの仕事に興味がある人
  • 朝日新聞社の技術者の仕事に興味がある人
  • 自然言語処理の研究をしている人
  • ご自身のモデル構築のスキル・プログラミングスキルを試してみたい人
  • オンラインでアドバイスを受けながら開発をしてみたい人
  • コンペティションに参加してみたい人

※自然言語処理のコーディング経験は不問です。ただし、何らかの機械学習モデルの構築経験をお持ちの方を対象としたプログラムとなっていますので、機械学習のコーディングの基礎に関するインプットはございません。

朝日新聞社・朝日新聞社メディア研究開発センターについて

株式会社朝日新聞社は、全国紙「朝日新聞」の発行はもちろん、書籍の出版・イベントやスポーツなどの興行事業・広告メディア事業などを幅広く手がける総合メディア企業です。近年では「朝日新聞デジタル」を主軸に外部配信事業などデジタル戦略にも注力しています。

朝日新聞社メディア研究開発センターは、2021年4月に発足しました。人工知能をはじめとする先端技術と、新聞社ならではの豊富なテキストや写真、音声などの資源を活用し、社内外の問題解決を目指すとともに、自然言語処理や画像処理をはじめとした先端技術の研究・開発を進める組織です。朝日新聞社には2021年現在、約30年、1000万記事がデジタルデータ化されています。この膨大な言語資源や、その他日々の活動で生み出されていく資源を用いて、社内業務の改革や新しいビジネスの開発を進めていくことを目指しています。

メンター(予定)

田森 秀明
メディア研究開発センター 次長
博士(情報科学)

2003年朝日新聞社入社。製作本部東京発送部、システムセクション、メディアラボを経て現職。2015年7月~2016年6月スタンフォード大学アジア太平洋研究所客員研究員。画像処理、自然言語処理の研究に携わる。

田口 雄哉
メディア研究開発センター

2017年に入社し、メディアラボ・ICTRADを経て現職。要約をはじめとする自然言語処理の研究開発に従事。

新妻 巧朗
メディア研究開発センター

2021年に入社し、自然言語処理・データ分析(データジャーナリズム)を担当。Web領域のソフトウェアエンジニアを経て、奈良先端大にて自然言語処理を研究。同大の修士課程を修了した。

山野 陽祐
メディア研究開発センター

2018年に入社。ICTRADを経て、現職。音声認識の研究とアプリケーション開発に従事。最近、好きな食べ物がペヤングからトンカツに変わった。

※参加メンターは追加・変更となる場合がございます。

PROJECT OUTLINE プロジェクト要項

イベント要項・募集要項

イベント概要
当日発表されるデータとテーマに基づきモデルの精度を競うコンペディション形式のオンラインイベントです。
主催
株式会社朝日新聞社
日時
2022/10/15(土) 10:00~18:00
2022/10/16(日) 10:00~19:00
※二日間通しての開催となりますので、両日のご参加をお願いいたします。
※終了時間は前後する場合がございます。
※2日目の終了後、優秀者にはインタビューを実施いたします。20:00ごろまでは予定を空けていただきますようお願い申し上げます。
応募締切
2022/9/26(月) 17:00予定
※応募者多数の場合、早期締め切りとなる場合がございます。
開催方法
オンラインでの開催となります。 ※1
通話・コミュニケーションツール
Zoom・Slack(予定)
(詳細は事前案内に記載)
募集人数
20名
※応募者多数の場合、Peakersマイページに入力されたプロフィールを元に選考を行う場合がございます。
応募資格
大学生・大学院生 ※2
服装
私服でご参加ください
準備物
  • 普段お使いで、ビデオ通話ができるPC
    └カメラ・マイク等についてはご準備ください。
  • 通話や開発が可能なインターネット環境 ※3
  • Google アカウント
    └Google Coraboratory(開発環境)の使用のため、お持ちでない場合は事前にご準備をお願いいたします。
  • 特典
    Amazonギフト券を最優秀者など上位三名に進呈予定

    ※1 イベントに参加される場所について

  • 本イベントは、2日間の長時間開催となります。
    ご自宅や学校など、長時間の滞在が可能な場所からご参加をお願いいたします。
  • 不特定多数の方が利用される公共施設や、飲食店などからのご参加は、周囲の方へのご迷惑になる可能性がございますので、固くご遠慮ください。
  • ※2 応募資格の詳細に関して

  • 国籍の制限はございませんが、運営・進行は日本語での対応のみとなります。
  • 応募者多数の場合、2024年3月卒業予定の方を優先させていただくことがございます。
    └大学院進学等によりPeakersプロフィールの卒業年度に変更のある方は、締切日までに最新化のご対応をお願いいたします。
  • ※3 インターネット環境について

  • インターネット通信費用は、参加者様のご負担となります。
  • プログラム期間中はインターネット通話を多数行っていただきます。
    通信速度・機器状態等は事前にご確認をお願いいたします。
  • セキュリティ上、各種フリーWi-Fiのご利用は固くご遠慮ください。
  • その他ご注意事項

    参加同意書について
    当選後、参加が確定した方には参加同意書をご締結いただく必要がございます。
    詳細は当選後ご案内いたしますが、当日までにご締結いただけない場合、参加URLの送付などが行えずご参加いただけない場合がございます。

    本人確認について
    本人確認のため、必ず会議通話への入室・開会式へのご参加をお願いいたします。
    開会式を無断欠席された場合、ツールへの招待を取り消す・登録を削除するなどの対応を行うことがございます。やむを得ずキャンセル・遅刻をされる場合は、必ず事前にご連絡をお願いいたします。

    ご当選後のお問い合わせにつきまして
    本イベントの主催は株式会社朝日新聞社となります。
    当選後のキャンセル・お問い合わせ等につきましては、お手数ですが株式会社朝日新聞社側の所定の連絡先へお願いいたします。Peakersにお問い合わせいただきましてもお答えできない場合がございますので、あらかじめご了承ください。

    TIME TABLE タイムテーブル

    1日目

    09:45
    集合
    10:00
    開会・開会式
    10:15
    課題説明
    10:30
    ワーク
    13:00
    ランチ
    14:15
    ワーク・初日フィードバックなど
    18:00
    初日終了

    2日目

    09:45
    集合
    10:00
    開会・2日目挨拶
    10:15
    ワーク
    13:00
    ランチ
    14:15
    ワーク
    17:00
    課題解説講義
    17:30
    休憩
    17:45
    リフレクションワーク
    18:30
    閉会式
    19:00
    終了

    ※優秀者には2日目の終了後インタビューを行います。
    ※タイムテーブルは変更となる場合がございます。