機械学習は不妊治療にどのように役にたつの?
論文を読んでいると、「このパラメーターは不妊原因となります。」「この治療をすると結果がよくなります。」という一つの事象に着目して展開する切り口が大半です。現在までの統計の過程を考えると仕方ないのですが、不妊原因は夫婦にあり、年齢など経時的に変化するため一元的に説明できないことがよくあります。
機械学習が不妊患者様の治療決定・意思決定には相性がよいのでは?と以前より思っていますが、専門分野が違うとチンプンカンプンで連携を取るにも最低限の知識をいれなくてはと思っています。
当院はデータ開示には力をいれていますが、機械学習については今後の課題です。最近の論文ではどのようなものがあるか調べてみました。
機械学習の論文は、どの論文も「治療を開始する前に、治療開始するうえでのカウンセリングの参考に役立つ」としています。確かに、不妊クリニックでは患者様の費用対効果なども考え、必要ない検査は後回しにしながらタイミング→人工授精→体外受精とステップアップしていきますが、初めの段階で現在よりも詳しく治療成功率や検査・治療選択の意思決定を促すことで出来れば尚いいですね。
私たちも積極的に機械学習を行っている研究者や企業の皆様達と連携をとっていきたいと思います。
≪様々な機械学習の精度を比較した論文①の紹介≫
Payam Aminiら. Int J Fertil Steril. 2021. DOI: 10.22074/IJFS.2020.134582
いくつかの分類法を用いて、不妊カップルの背景・卵子、精子、胚に関する利用可能なデータを用いて、体外受精後の成功分娩を分類することを目的としました。イラン(テヘラン)の不妊センターで2011年3月21日から2014年3月20日までに治療を行なった6071周期のデータを集計しました。分娩成功率を予測するためにsupport vector machine (SVM)、extreme gradient boosting (XGBoost)、logistic regression (LR)、random forest (RF)、naive Bayes (NB)、 linear discriminant analysis (LDA)の6種類の機械学習アプローチを用い、各手法の結果は精度ツールを用いて比較しました。
4930サイクルのうち、分娩成功率は81.2%であった。総合的な精度は、6つのアプローチの中でrandom forest (RF)が最も優れた性能を示しました(ACC=0.81)。変数の重要性については、受精卵の数、ICSIした卵子数、不妊原因、女性年齢、多嚢胞性卵巣症候群(PCOS)が分娩成功を予測する最も重要な因子でした。
(機械学習に用いた因子:女性年齢、不妊の原因(女性因子、男性因子、男女複合因子、原因不明)、不妊(原発性、続発性)、BMI、不妊期間(年)、流産回数、PCOS、体外受精の既往回数、回収卵子数、ICSIした卵子数、受精卵の数、移植胚の数、精液所見、ICSIの受精率、正常受精率、移植胚の質に関するデータ、胚移植時期)
≪様々な機械学習の精度を比較した論文②の紹介≫
Ashish Goyalら. Sci Rep. 2020. DOI: 10.1038/s41598-020-76928-z
Human Fertilisation and Embryology Authority (HFEA)から提供された公開データセット(2010年~2016年に収集した匿名化された495,630人の患者記録から30項目を抽出)を用いて、古典的な機械学習、深層学習アーキテクチャ、およびアルゴリズムのアンサンブルを含む様々なAIアルゴリズムを比較しました。学習プロセスには、特徴選択なしと特徴選択ありの2つの設定があり、分類器モデルを学習します。機械学習、深層学習、アンサンブルモデルの分類パラダイムが、両方の設定で学習されています。
特徴選択なしの設定では、Random Forestモデルが76.49%と最も高いF1スコアを達成しました。同じモデルについて、精度、リコール、ROC曲線(ROC AUC)のスコアは,それぞれ77%,76%,84.60%でした。
(機械学習に用いた因子:女性年齢、体外受精の既往治療周期数、体外受精妊娠数、出生数、不妊期間、不妊原因、精液所見、卵子(自己、ドナー)、新鮮胚・凍結胚、移植胚数など30項目)
文責:川井清考(院長)
お子さんを望んで妊活をされているご夫婦のためのブログです。妊娠・タイミング法・人工授精・体外受精・顕微授精などに関して、当院の成績と論文を参考に掲載しています。内容が難しい部分もありますが、どうぞご容赦ください。