Registration info |
参加枠1 Free
FCFS
増枠1 Free
FCFS
増枠2 Free
FCFS
|
---|---|
参加者への情報 |
(参加者と発表者のみに公開されます)
|
Description
KDD2021 参加報告&論文読み会 について
概要
27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining(KDD2021)は、機械学習やデータマイニング関連分野におけるトップカンファレンスの一つです。 本会議は、理論研究を対象とする Research Track と実問題を扱う応用研究を対象とする Applied Data Science Track からなる点が特徴です。
本イベントでは、産総研/三菱電機 吉村さんによるKDDCupの参加報告および論文紹介をLT形式で発表します。
学生、社会人、アカデミア問わず興味のある方でしたら、どなたでもご参加いただけます。是非お気軽にご参加ください!
(2021/09/22 追記)参加枠、増枠で "補欠者" になっている方にもZOOM URLの送付・参加が可能です。奮ってご応募ください!
実施方法
- ZOOMを使用します。各自事前にインストールをお願いします。
- URLは当日までに、connpassのメッセージ機能で登録者に事前にお送りいたします。
- 参加報告と論文紹介LTの発表時間は35分と15分(質問はチャットで回答)となります。
参加される方への事前のお願い
- 事前に配布されるZOOM URLはイベント直前までにアクセスされますとエラーとなり、イベント中に参加ができなくなってしまうケースがございます。必ず 2021/09/24 18:30以降にアクセスくださいませ。
- 発表内容に関する質問はチャットにお願いします。
- Twitterへの投稿にはハッシュタグ「#kdd2021_yomikai」を付けて頂けると嬉しいです!
対象者
学生・社会人問わず以下に該当する方
- データサイエンスにご興味をお持ちの方
- 広告・小売業界におけるデータサイエンスの活用にご興味をお持ちの方
- 経済学の応用にご興味をお持ちの方
登壇者紹介
吉村 玄太 産業技術総合研究所 | 三菱電機 / リサーチャー @intellygenta
"KDD Cup 2021 時系列異常検知コンペ 参加報告"
KDD Cup 2021の時系列異常検知コンペ Multi-dataset Time Series Anomaly Detection の概要説明、上位解法の整理、5位入賞した解法の紹介を行う。
兵頭 亮介 CyberAgent / データサイエンティスト @onysuke
"SizeFlags: Reducing Size and Fit Related Returns in Fashion E-Commerce"
EC市場が急速に拡大する中、返品率の増加が問題となっている。特に、アパレルECにおける返品の多くはサイズやフィット感によるものであり、カスタマーエクスペリエンスや収益性に深刻な影響をもたらす。この課題に対して、顧客により弱くアノテーションされた返品データを用いたベイジアンモデル、SizeFlagsを提案した。ベイジアンモデリングの利点を活かし、専門家のフィードバックや商品画像情報を事前知識として組み込むことが可能である。A/Bテスト及びプロダクション環境での継続的な評価により、提案手法による情報提示がサイズに起因する返品を削減することを示した。
藤田 光明 CyberAgent / データサイエンティスト @6km6km
"Trustworthy and Powerful Online Marketplace Experimentation with Budget-split Design"
A/Bテストは効果検証のゴールドスタンダードだが、その有効性は不偏であることと検出力次第である。買い手と売り手が存在するようなオンラインマーケットプレイスにおけるA/Bテストは、バイアスと検出力不足の問題に直面しやすい。そこでこの論文は、budget-splitting designと呼ばれる手法を提案している。これは、買い手が有限または無限の予算を持つケースにおいて、検出力が高くバイアスのない実験デザインである。
白木 紀行 CyberAgent / データサイエンティスト @mori_kogai
"Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach"
生鮮食品は賞味期限が短く価格変更の機会も限られているため、価格を変えた場合の売上予測が難しい。本論文では、解釈可能性を担保するため、まずセミパラメトリックな需要関数を推計した上で、利益を最大化する多期間のダイナミックプライシング・アルゴリズムを設計した。提案手法は効率的であり、実際のECに導入され、収益改善に貢献した。
金子 雄祐 CyberAgent / データサイエンティスト @coldstart_p
" Learning a logistic model from aggregated data"
"Clustering for Private Interest-based Advertising"
近年のユーザープライバシー保護の流れから、ターゲティング広告事業者は従来の広告配信機構の変化を要請されている。 これらの流れに対する取り組みとして、プラットフォーマー側からはGoogleのFederated Learning of Cohorts(FLoC) APIに関する論文を、配信事業者側からはCriteoの集計データを用いた予測モデルアプローチをそれぞれ紹介する。
森脇 大輔 CyberAgent / リサーチサイエンティスト @dmoriwaki
"Uplift Modeling with Generalization Guarantees"
Upliftはモデルの事前評価が難しい。Upliftの評価方法のひとつであるAUUCを分解することで下限を求めることを提案し、それを最大化するようなモデルを学習することで従来より性能の高いモデルが学習できることを示した。
タイムテーブル
時間 | 論文タイトル | 登壇者 |
---|---|---|
18:30~ | 開場 | - |
19:00~ | 開会 / CyberAgent紹介 | - |
19:10~ | KDDCup参加報告 | 吉村 玄太(産業技術総合研究所 / 三菱電機) |
19:45~ | SizeFlags: Reducing Size and Fit Related Returns in Fashion E-Commerce | 兵頭 亮介(CyberAgent) |
20:00~ | Trustworthy and Powerful Online Marketplace Experimentation with Budget-split Design | 藤田 光明(CyberAgent) |
20:15~ | Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach | 白木 紀行(CyberAgent) |
20:30~ | Learning a logistic model from aggregated data Clustering for Private Interest-based Advertising |
金子 雄祐(CyberAgent) |
20:45~ | Uplift Modeling with Generalization Guarantees | 森脇 大輔(CyberAgent) |
21:00~ | 閉会 | - |
※ 質疑応答はチャットで行う形式とします
注意事項
- 画面撮影、録画、SNS等への資料内容の転載などはご遠慮ください。
- イベントの写真を撮らせて頂く場合がございます。
- 営業や採用目的の参加はご遠慮願います。
- 参加不可の場合は事前キャンセルをお願いします。
- その他当日お困りごとがあった際はsadachika_miku@cyberagent.co.jpへご連絡いただければと思います。