Kaggle Grandmasters of NVIDIA (KGMoN) たちが、NVIDIA によって加速されたデータ サイエンスを、勝利したレコメンダー システムの構築、RNA 分子の分解率の予測、医用画像におけるメラノーマの特定などにどのように利用したかをご紹介します。
Bo Liu
NVIDIA シニア データ サイエンティスト
Chris Deotte
Christof Henkel
NVIDIA データ サイエンティスト
David Austin
NVIDIA システム ソフトウェア プリンシパル エンジニア
Gilberto Titericz
Jean-Francois Puget
NVIDIA の名誉エンジニア
Jiwei Liu
Kazuki Onodera
Théo Viel
NVIDIA ディープラーニング シニア データ サイエンティスト
2022 年 3 月と 5 月
2 つの異なる大会で、チームは自然言語処理を使用して学生の論述を分析し、医師免許試験の患者ノートで重要なフレーズを特定しました。
(58:24 分)
2021 年 6 月
NVIDIA Merlin と KGMON のチームが RecSys Challenge 2021 で 1 位を獲得しました。数百万件のデータセットで、ユーザーのエンゲージメントの確率を効果的に予測しました。
(1:10 分)
2021 年 3 月
このレコメンデーション システム課題の目標は、匿名化された無数の宿泊予約 (実際の宿泊予約) に基づくデータセットを利用し、リアルタイムで次のベスト旅行先を推奨する戦略を考えることです。
(49:11 分)
このビデオでは、自然言語処理の歴史の簡単な紹介と現状、また、4 つの異なるコンペティションで Hugging Face の Transformers を使用するためのベスト プラクティスも紹介しています。
(1:06:02)
2020 年 10 月
この競技では、機械学習モデルを開発し、RNA 劣化法則を考案するという課題がチームに与えられました。このモデルでは RNA 分子のベースごとに考えられる分解率を予測する必要があり、3000 超の RNA 分子 (無数の配列と構造がある) と各位置の分解率からなる Eterna データセットのサブセットでトレーニングしました。
(56:56 分)
2020 年 9 月
このランドマーク レコグニション チャレンジでは、複雑なテスト画像からなるデータセットの中に正しいランドマークがあればそれを認識するモデルを構築するという課題がチームに与えられました。これは「言うは易く行うは難し」です。ランドマーク レコグニションには、大量のクラスが含まれます。たとえば、このコンテストではクラスの数が 81,000 以上ありました。
2020 年 8 月
このコンテストでは、患者の画像から皮膚病変を特定し、黒色腫を示す可能性が最も高い画像を判断する ML モデルを作成するという課題がチームに与えられました。賞を得た ML モデルでは、平均的な皮膚科医よりも早期かつ正確に黒色腫を同定することができました。
「Grandmaster Series」は、データ サイエンティストのための月刊教育ビデオ シリーズです。各エピソードで、データ サイエンスの世界を牽引するエキスパートたちがその考え、ベスト プラクティス、最近の大会から得られた重要な学びについてご紹介します。是非視聴して、エキスパートたちが学んだことを自身のデータ サイエンスの課題の応用にお役立てください。
NVIDIA プライバシー ポリシー