Read in English

スペクトルピーク検出におけるディープラーニングの応用

シェア

本記事では、スペクトルピーク検出におけるディープラーニング手法を概観し、2つのアプローチを比較します。1つはYOLO (You Only Look Once) モデル に着想を得たセグメントベースの識別であり、1D CNN(畳み込みニューラルネットワーク)を用いてスペクトルを区間に分割し、推論時のパラメータ調整なしでピークを検出します。この手法は高速に動作し、重なり合ったピークにも対応できますが、ピークが密集したスペクトルには弱い傾向があります。もう1つは適応的ROI分類であり、閾値ベースの検出とCNNを組み合わせて関心領域を分類します。この手法は、多数のピークを含むスペクトルや多様なスペクトル種に適していますが、計算時間が長く、実装も複雑です。両手法は、従来の閾値ベース手法に対する代替手段であり、選択はスペクトルの特性やタスクの要件に依存します。

Thanakrit Yoongsompornさんのプロフィール写真

Thanakrit Yoongsomporn

Institute of Science Tokyo

I am a master's student at Institute of Science Tokyo specializing in time series data analysis and machine learning. I am currently working as a data scientist intern at MI-6, where I focus on developing spectral analysis techniques including preprocessing, peak detection, and peak grouping for integrating miHub and LA. My experience encompasses analysis of various spectral data types, including XRD, FTIR, and Raman spectra.

スペクトル解析におけるピーク検出

前回の記事「材料科学におけるスペクトルデータ解析」では、スペクトル解析におけるピーク検出ベースのアプローチの重要性と限界を強調しました。各ピークと材料特性の関係を特定することで、このアプローチは高い解釈性を持ち、より深い理解を必要とする研究、設計、実験に適しています。しかし、その有効性はピーク検出結果の精度に大きく依存します。このため、ピーク検出の精度をいかに安定的に確保するかは、スペクトル解析全体の信頼性を左右する課題となっています。

スペクトル解析でピーク検出を行う主なアプローチには、閾値ベースのアプローチとディープラーニングベースのアプローチの2つがあります。閾値ベースのアプローチは、より伝統的に用いられてきました。しかし、最適なピーク検出結果を得るには、各スペクトルに応じた適切なパラメータが必要であり、このパラメータ設定は難しい一方で不可欠な工程です。一方、ディープラーニングベースのアプローチは、精度を犠牲にせず自動化に適した代替手段として、近年注目を集めています。ディープラーニングでスペクトルデータから直接パターンを学習することで、パラメータを都度調整しなくてもピーク検出を行うことができ、閾値ベースのアプローチの限界を乗り越えます。さらに、ディープラーニングモデルは複雑な信号形状にも適応できる可能性があり、ピークのデコンボリューション(重なったピークを分離する処理)などの追加処理を最小限に抑えられる可能性があります。

本記事では、ピーク検出手法をアルゴリズムの違いならびにスペクトルデータからピークをどのように表現し、同定するかという観点から整理します。この観点では、本稿で扱う手法は、強度ベース、セグメンテーションベース、局所形状ベースのアプローチとして捉えることができ、それぞれがスペクトルの異なる解釈の仕方を反映しています。

深層学習ベースのアプローチ

本記事では、ピーク検出タスク向けに設計された、よく知られたディープラーニングベースのモデルをいくつか取り上げます。スペクトルのピーク検出においてディープラーニングが活用される方法は、主に2つあります。すなわち、セグメントベースのピーク識別と、適応的ROI画像分類です。

1. セグメントベースのピーク識別

適切なセグメント分割により重なり合ったピークを分離して検出できる例。AI4Scienceや材料AIにおける複雑スペクトル解析への応用を示す。

図1. セグメントベースピーク識別のワークフロー

セグメントベースのピーク識別は、自然画像処理における物体検出タスクから応用されたディープラーニングモデルに基づいて実装されます。これは、画像全体の中から物体を見つけ、その位置(バウンディングボックス、対象物を囲む枠)とクラスを識別するために一般的に用いられるYOLO(You Only Look Once)の考え方を、スペクトルデータに適用したものです。通常、予測されたクラスには、その物体がそのクラスに属する確率が対応づけられます。したがって、スペクトル解析では、これを用いて画像中にピークが存在する確率を判断できます。この場合、ラベル付けされたクラスはピーク(確率 = 1)と非ピーク(確率 = 0)から構成されます。モデルは0から1の間の値を予測し、値が高いほど検出されたピークに対する信頼度が高いことを表します。通常は0.5の閾値が用いられ、その値を超えた場合にピークが存在すると判断します。ピークの存在確率に加えて、モデルはピークの相対位置と対応するピーク面積も予測できます。自然画像とは異なり、ここで扱う入力はスペクトル軸に沿った1次元信号であるため、1D CNNが自然な選択となります。

不適切なセグメント分割により広いピークが誤って複数ピークとして検出される例。計測インフォマティクスにおけるピーク検出精度の課題を示す。

図2. (a) 適切なセグメント分割によりピーク分離が可能な例 (b) 不適切な分割により偽陽性が発生する例

前述の概念を適用するために、スペクトルは等しい長さの複数の小さなセグメントに分割されます。CNNモデルはスペクトル全体を入力として受け取り、各セグメントごとにラベルを出力します。このラベルには、ピークの存在確率、相対的なピーク位置、ピーク面積が含まれます。本手法では、各セグメントにつき最大1つのピークを仮定しています。そのため、セグメント幅がピーク間隔に対して大きすぎる場合、近接した複数のピークが同一セグメントに含まれてしまい、一部のピークが検出されない可能性があります。

一方で、各セグメントに対して局所的にピークを推定する構造により、1つの実際のピークが複数のセグメントにまたがって表現されます。この性質によって、図2(a)に示すような重なりピークや未分離ピークについても、各セグメントに現れる局所的な特徴を手がかりとして検出することが可能になります。未分離ピークとは、見かけ上は1つのピークに見えるものの、実際には2つの別個のピークが重なっている状態を指します。これは他のピーク検出ワークフローでは難しい課題であり、通常は専用のデコンボリューションを必要とします。しかし、ピークが異常に広い場合やセグメンテーションが不適切な場合には、通常のピークが未分離ピークと誤認され、図2(b)に示すように偽陽性の原因となることもあります。

このようにスペクトル全体を一様に分割して扱う手法に対して、ピーク候補の周辺に着目して局所的に評価するアプローチとして、次に述べる適応的ROI画像分類が挙げられます。

2. Adaptive ROI image classification

適応的ROI画像分類は、事前に別の予備的なピーク検出法で検出されたピーク周辺のROI(Region Of Interest、関心領域)を、ディープラーニングモデルによって3つのクラスに分類するアプローチです(図3)。3つのクラスとは、ピークを含む、ピークを含まない、さらに手動で調べる必要がある、の3つです。予備的なピーク検出法としては、従来の閾値ベースのピーク検出法が用いられます(図4)。例えばXCMSがその一例です。前述の通り、閾値ベースのアプローチでは最も高い精度を得るために適切なパラメータ設定が必要です。しかし、この場合には、偽陽性が増えることを許容してでも、偽陰性を減らすことを優先しながら、必ずしも最適ではないパラメータを用いることが可能です。なぜなら、偽陽性はCNNモデルによって後から除去できますが、この過程で新たなピークが追加で検出されるわけではないため、偽陰性を減らすことはできないからです。予備的なピーク検出の後、ROIはそれぞれのピークの特性、例えばFWHM(Full Width at Half Maximum、半値全幅)やピーク周辺のスペクトル強度に基づいて抽出できます。こうして得られた適応的ROIは、最大値が同じになるように再スケーリングされ、ディープラーニングモデルへの画像入力として扱われます。

閾値ベース検出とCNNを組み合わせ、ROI領域を分類してピークを抽出する適応的ROI画像分類手法の流れ。材料AIおよびAI4Scienceにおけるスペクトル解析の高度化を示す。

図3. ROI画像分類のワークフロー

近年の技術が自然画像中の物体識別に可能性を示しているのと同様に、CNNモデルはこのピーク分類タスクにも適用できます。各ROI画像は2D CNNモデルに入力され、クラス分類が行われます。モデルは一般に、ピークが各クラスに属する確率を出力し、それらの合計は1になります。そして、最も高い確率を持つクラスが、最終的なピークのフィルタリング結果として採用されます。このモデルはROI画像の形状やパターンから学習しているため、各ROIの外側にあるピーク強度に関する情報は学習しません。この性質により、測定条件や強度スケールの違いに対して頑健であり、異なる種類のスペクトルにも適用しやすい一方で、ピークの相対的な重要度や全体構造との関係を考慮した判断は難しくなります。

スペクトルに対して前処理と閾値判定を行い、一定強度以上のピークのみを抽出する閾値ベースピーク検出手法の概念図。計測インフォマティクスにおける従来手法と材料AIによる自動化手法の比較基盤を示す。

図4. 従来の閾値ベースのピーク検出

各ROIにクラスが割り当てられた後、「少なくとも1つ以上のピークを含む」と分類されたものについては、さらに別のCNNモデルで処理されます。この2つ目のモデルは、画像セグメンテーションタスク(画像内のどの領域が対象に対応するかを画素レベルで推定する処理)で、広く用いられるU-netに類似した構造であることが多いです。このモデルは、そのROI内のピーク領域を特定するために用いられます。これにより、ピーク位置とピーク面積の決定が可能になります。ただし、両方のCNNモデルについて、学習時に用いる各ROIのラベルは手作業で付与しなければなりません。

どの手法を選ぶべきか

以上で紹介した各手法の特徴を踏まえ、それぞれの適用範囲を整理すると次のようになります。

手法

利点

欠点

閾値ベース

柔軟

最適結果のために適切なパラメータ調整が都度必要

セグメントベース

短時間でエンドツーエンドのピーク検出が可能

重なりピークや未分離ピークを検出できる

1セグメント1ピークの制約によりピーク数が多いスペクトルに弱い

広いピークを未分離ピークと誤認する可能性

適応的ROI画像分類

既存のピーク検出手法に追加可能

ピーク数の多いスペクトルに適する

処理工程が長く、計算時間が増加する

セグメントベースピーク識別は、重なりピークや未分離ピークが多い複雑なスペクトルに適していますが、セグメント分割が固定であるため、ピーク位置によっては誤検出が生じる可能性があります。特に、分割境界がピーク近傍に位置する場合、図2(b)のように不正確な結果を招く可能性があります。

一方、適応的ROI画像分類は各ピークに適したROIを用いるため、この問題を回避できます。また、ピーク数の多いスペクトルにも適しており、セグメント数に制約されません。さらに、LCMSやXRDなど異なる種類のスペクトルにも適用しやすく、局所的な形状のみを評価するという特徴があります。

ただし、この手法は実装コストが高く、処理ステップも多いため、セグメントベース手法の2倍以上の計算時間を要する場合があります。また、学習には手動ラベル付けが必要です。一方で、セグメントベース手法ではスペクトルシミュレーションを利用することも可能です。

本稿で紹介した各手法は、いずれもピーク検出という同じ目的を扱いながら、その定義の仕方が異なります。閾値ベース手法は強度に基づいてピークを判定し、セグメントベース手法はスペクトル全体を分割した上で確率的にピークを捉えます。適応的ROI分類はピーク周辺の局所形状に着目して判断します。この違いは、どのようにピークを表現し、どの情報を重視するかの違いに対応しています。そのため、手法の選択は精度比較ではなく、対象とするスペクトルの性質や、どのレベルの情報を安定して抽出したいかという観点から考える必要があります。

参考文献

  1. Jirayupat , C. (2024, November 28). Spectral Data Analysis in materials science : Core approaches towards integration with Materials Informatics. miLab. https://milab.mi-6.co.jp/article/t0003en#hbe345fc161 
  2. Mottershead, K., & Miller, T. H. (2023). Application of deep learning to support peak picking during non-target high resolution mass spectrometry workflows in environmental research. Environmental Science: Advances, 2(6), 877–885. https://doi.org/10.1039/d3va00005b 
  3. Melnikov, A. D., Tsentalovich, Y. P., & Yanshole, V. V. (2019). Deep learning for the precise peak detection in high-resolution LC–MS data. Analytical Chemistry, 92(1), 588–592. https://doi.org/10.1021/acs.analchem.9b04811 
  4. Kensert, A., Bosten, E., Collaerts, G., Efthymiadis, K., Van Broeck, P., Desmet, G., & Cabooter, D. (2022). Convolutional neural network for automated peak detection in reversed-phase liquid chromatography. Journal of Chromatography A, 1672, 463005. https://doi.org/10.1016/j.chroma.2022.463005 
  5. Smith, C. A., Want, E. J., O’Maille, G., Abagyan, R., & Siuzdak, G. (2006). XCMS:  processing mass spectrometry data for metabolite profiling using nonlinear peak alignment, matching, and identification. Analytical Chemistry, 78(3), 779–787. https://doi.org/10.1021/ac051437y 
  6. Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You only look once: Unified, real-time object detection. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 779–788. https://doi.org/10.1109/cvpr.2016.91 
  7. Ronneberger, O., Fischer, P., & Brox, T. (2015). U-Net: Convolutional Networks for Biomedical Image Segmentation. Lecture Notes in Computer Science, 234–241. https://doi.org/10.1007/978-3-319-24574-4_28