2020年10月29日、MITが携帯電話で録音された咳の音声データをAIアルゴリズムで解析することで、COVID-19の感染有無を判定することができる技術を開発したと発表した。

この技術は、感染していると自覚していない人が実際には感染していることを明らかにする簡易スクリーニングとして適用できる可能性があることを示している。

咳の音声を解析するAI

この技術は、2020年9月30日にIEEE Journal of Engineering in Medicine and Biologyで発表された論文「COVID-19 Artificial Intelligence Diagnosis using only Cough Recordings」に基づいている(論文ページ)。

研究チームは、携帯電話で記録をした咳の音声を通じ、無症候性の人と健康な人を区別するAIモデルについて報告している。なお、この音声データは、一般の人がWebブラウザや携帯電話やラップトップなどのデバイスを介して録音したデータが提供されたものとなっている。

今回のリリースでは、数万件もの咳の音声サンプルと、通常の話し言葉の音声によってAIモデルを学習させている。被験者がAIモデルに新しい咳の音声データを入力として与えると、AIモデルがCOVID-19に感染しているかどうかを判定する。結果としては、COVID-19に感染している人の咳において、98.5%の感度・94.2%の特異度で判定ができた。そして感染の自覚が無い人の咳では、100%の感度・83.2%の特異度で判定ができたという。

SoundCloud上でMITが症状のある人と無い人の咳を解説している

MITの咳AI判定ツールの解析(SoundCloud)への直リンク

今回のリリースでは、数万件もの咳の音声サンプルと、通常の話し言葉の音声によってAIモデルを学習させている。被験者がAIモデルに新しい咳の音声データを入力として与えると、AIモデルがCOVID-19に感染しているかどうかを判定する。結果としては、COVID-19に感染している人の咳において、98.5%の感度・94.2%の特異度で判定ができた。そして感染の自覚が無い人の咳では、100%の感度・83.2%の特異度で判定ができたという。

元々、MITの研究チームはパンデミックが発生する前から、肺炎や喘息などの状態を正確に診断するために、咳の携帯電話の録音データを使った判定アルゴリズムを学習していた。なお、このアルゴリズムはResNet50という一般的な畳み込みニューラルネットワークを使っており、今回もこうしたアルゴリズムがベースになっている。

「このグループ診断ツールを効果的に実装すると、教室、工場、レストランに行く前に全員が診断ツールを使用すれば、パンデミックの蔓延を減らすことができます」と、MITのAuto-ID Laboratoryのリサーチャーで、今回の共著者でもあるBrian Subirana氏は述べている。

ソース:MITニュースリリース


ー 技術アナリストの目 -
この領域はVocal Biomakerと言って音声データから症状や病気の兆候を検知する技術が様々なベンチャー企業や大学研究機関で開発されている、非常にホットな市場である。音声を活用する意味は、スケーラビリティと手軽さだ。侵襲的な検査は何も必要なく、即時的に、音声だけで診断や診断補助ができることの価値は高い。スマホやPC、タブレットなど、音声を記録するツールは日常にあふれており、こうした簡便さから、注目を集めている。