[特別座談会]

マテリアルDXへの挑戦 ―難ルートの開拓で挑む、高い頂―

文部科学省が推進している「マテリアルDXプラットフォーム構想」では、「マテリアル先端リサーチインフラ(ARIM)」、「データ中核拠点(MDPF)」、「データ創出・活用型マテリアル研究開発プロジェクト(DxMT)」の3事業が連環を形成し、三位一体で構想の実現に取り組んでいる。なかでも、NIMSはMDPF事業の唯一の実施機関として、日本全国から材料データを収集・蓄積し、それを利活用するための仕組みづくりとインフラの整備を進めている。今回はMDPF事業を統括する源聡、門平卓也、桑島功の3名に、現状と展望を聞いた。


源 聡Satoshi Minamoto

技術開発・共用部門 材料データプラットフォーム プラットフォーム長/ データ活用ユニット ユニットリーダー

門平 卓也Takuya Kadohira

技術開発・共用部門 材料データプラットフォーム 副プラットフォーム長/ データ基盤ユニット ユニットリーダー

桑島 功Isao Kuwashima

技術開発・共用部門 材料データプラットフォーム データ収集ユニット ユニットリーダー

データ戦略の要、MDPFの役割

―「マテリアルDXプラットフォーム構想」の柱の一つ、「データ中核拠点(MDPF)」事業の取り組みを教えてください。

源:MDPFでは、高品質な材料データの収集・蓄積・流通・利活用を目指し、各種データサービスの拡充と、運用インフラの整備を進めています。材料データの入口(つくる)から、蓄積(ためる)、出口(つかう)まで、一貫して扱うことをコンセプトに掲げています。

門平: NIMSは2010年代半ばから、材料データを“つくる・ためる・つかう”の連環をNIMSの中で実践してきました。2020年代に入り、マテリアルDXプラットフォーム構想のもと、それを全国の研究機関や大学を含めた大きな連環へと広げることになり、現在はその実現に必要な施策の検討と実装を進めている状況です。

桑島:MDPFの組織としては、私は材料データを収集する「データ収集ユニット」、門平さんはシステム全体のインフラ整備を担う「データ基盤ユニット」、源さんは材料データの活用を推進する「データ活用ユニット」を統括していますが、実務においてはユニットの垣根はなく、全員が「MDPFを先鋭的に進化させ、かつ安定的に稼働させる」という目標を共有し、一丸となって取り組んでいます。

―データ戦略の最初のステップは、材料データを収集し、蓄積することですが、それはどのような状況にありますか。

桑島: NIMSでは2003年から、世界最大級の材料データベース「MatNavi」の整備を行ってきました。MatNaviは、無機材料、金属材料、高分子材料など、十数種類のデータベースといくつかのアプリケーションで構成されています。私たちデータ収集ユニットでは、論文から必要な項目を抽出したり、NIMSで実施している材料試験の結果を預かったり、ときには計算を行い、フォーマットを統一してデータベースに登録する作業を担っています。論文からの情報抽出は専門家の目利きによるものですし、クリープ試験などの材料試験についてもNIMSが同一規格で実施してきたことから、MatNaviの収録データは高い品質を誇ります。これはMDPFの主力サービスの一つです。

門平:MatNaviの整備と並行して、MDPFでは「RDE(Research Data Express)」というサービスを介し、データ収集を進めています。RDEとは、遠隔の実験装置からデータを転送し、人工知能(AI)による解析に適した形式でデータベースに蓄積するためのシステムです。元来、実験装置によって出力されるデータの用語やフォーマットは異なるため、1つのデータベースに蓄積するのは大変なことでしたが、RDEには用語の翻訳やメタデータの付与、フォーマットの変換などを自動で行う、いわゆる「構造化」の機能が備わっています。それにより、実験装置から出力されるデータをリアルタイムでMDPFの共用データベースに蓄積できるようになりました。
RDEはもともと、NIMS内に閉じたデータサービスの連環を実現するため、ローカルな環境で運用していました。そのRDEを2023年1月、MDPFのサービスラインナップに加えるとともに、MDPFが提供するサービスのシステム基盤をパブリッククラウドに移設しました。それにより、ARIMに参加する全国の研究機関や大学の実験装置からRDEを介し、オンラインでデータを収集・蓄積できる体制が整いました。つまり、ARIM、MDPF、DxMTの連環が本格的にスタートした形です。

データの利活用を促進する新サービス「pinax」

―材料データを収集して蓄積する基盤が整ったことで、次の段階として、データの利活用が本格化しているのですね。利活用の面では、MDPFとしてどんな構想を描いていますか。

源: 我々は以前から、蓄積してきた大量のデータを「どのように活用するか」について、何度も議論を重ねてきました。材料開発におけるDX化は過渡期にあり、データの最適な利活用方法に関して、まだ明確な答えはないのです。利活用方法の筆頭には、AIを用いたデータ解析が挙げられますが、その予測モデルをつくるためにも、試行錯誤が欠かせません。たとえば、解析のパラメータとして温度は必要か? ないほうがいいか? そうしたいろいろなケースを試す必要があります。

門平:AI解析を試すための“場”が必要だということは、データサービスの運用当初から議論を重ねていました。そして実際に、源さんが中心となり、2022年から開発をスタートしたのが「pinax」です。これは簡単にいうと、さまざまな予測モデルをつくり、MDPFが提供するデータセットなどを利用して解析を試行できるシステムです。現在、まずはNIMSの研究者に提供を始めた段階で、さらに多くの方にお使いいただけるよう準備を進めています。

源: pinaxでは、ユーザー個人の領域として、クラウドの仮想デスクトップ環境を利用できます。そこでユーザーは、あらかじめインストールしてある各種プログラミング言語や、共用の解析ツールを使ってオリジナルの予測モデルをつくり、自由にAI解析を試行することが可能です。一方で、予測モデルがどのデータをもとにどんな手順を経てつくられたのか、「来歴記録」が残る仕組みを構築しました。そこから、予測モデルの精度向上に寄与した要因は何か、といったフィードバックを得ることができます。「解析者がもつ“なぜ”に応えられるシステムをつくる」というのは、pinaxの開発に際して強く意識したポイントです。

桑島:pinaxでは、MDPFが提供するMatNaviなどのデータのほかにも、研究機関や大学が独自に所有しているデータを個人の領域にアップロードし、解析に利用することができます。また、作成した予測モデルを任意のメンバーと共有することも可能です。そうした、ユーザーにとって“安全な遊び場”であるという点は、強調しておきたいポイントです。そして、データ収集を担う私の立場としては、ぜひpinaxの利用を通じて、材料データの真価をご自身の研究に存分に活かしていただきたい、それに尽きます。

―システム同士の連携で引き寄せる「逆問題」解決の糸口
MDPFの各種サービスを利用して、どのような展開が起こることを期待していますか。

門平:今はとにかくMDPFのサービスを使ってデータの利活用事例を示すことが重要だと捉えています。その手段として、システム同士の連携を試行しています。
たとえば、「MInt」というシステムがあります。これは、材料工学の4要素、「製造プロセス」「組織」「特性」「性能」を強固に関連付け、一気通貫で予測することを目的としたシステムです。もともと、内閣府主導の「SIP」というプロジェクトで構造材料をターゲットに開発してきたものですが、SIP終了後は源さんが中心となり、あらゆる材料へと対象を広げて開発を続けています。このシステムでは、「モジュール」と呼ばれる多様な計算ツールを実装しており、それをつなぎ合わせて「ワークフロー」を構築します。ワークフローをたどることによって、たとえば、温度を上げると結晶粒が大きくなり、材料の強度が高くなる、といった相関を明確に記述できるように設計されています。ここで、pinaxで構築した予測モデルをMIntのモジュールとして組み込めないか、というような連携を考えるわけです。

源:MIntの画期的な点は、「逆問題」を解く一つの方法を与えたことです。材料開発では一般的に、製造プロセスを出発点に組織を探り、組織をもとに特性や性能を探ります。これを「順問題」と呼びます。「逆問題」とはそれとは逆に、材料に求められる性能を出発点に、組織を探り、それを実現する製造プロセスを探るという流れです。逆問題を解くことができれば試行錯誤の手間を大幅に削減できるため、材料科学者にとってその実現は悲願ですが、きわめて難易度が高いものです。それに対し、MIntは一つの解法を示したのです。
しかし今、「いかに解ける問題の範囲を広げるか」が大きな課題となっています。というのも、MIntにおける逆問題の解析プロセスは、「順問題の計算モジュールを使って多数の予測を実行したうえで、得られた結果全体を分析する」というもの。順問題の計算モジュールは複雑な工程を経てようやく実装できるものであり、モジュールを増やすことは決して簡単ではありません。それに対し、pinaxで機械学習の予測モデルを作成するのは格段に容易です。もしそれをMIntの計算資源として活用することができたなら、MIntが取り扱える問題の範囲を大きく広げることができます。さらに、機械学習モデルが行うのは複雑な計算ではないので、順問題を解く場合にも、そのスピードを格段に向上させることができます。このように、MInt単体で克服することが難しかった課題を、システム間連携によって解決できるのです。

門平:また、予測モデルの構築に必要な実験データやシミュレーションデータをpinaxへ容易に引き込めるように、RDEやMatNaviとの連携も強化しています。それにより予測モデルの構築が加速し、結果的に、逆問題を解く道筋を大きく広げることにつながります。将来的には、将棋でAIの参入によって打ち筋が拡大したような変革を、材料開発にももたらしたいですね。

源: 現時点でMIntの利用は、NIMSと企業数社で推進中のプロジェクト「構造材料DX-MOP」の参加メンバーに限られますが、まずは我々が率先してデータ利活用の道筋を探求し、新たなサービスを開拓していきたいと思っています。

「マテリアルDX」を死語にする

―さまざまなサービスを生み出し、DX化を推進するうえで留意している点と、将来的な展望をお聞かせください。

門平:さきほど「AI解析を試すための“場”が必要」と言いましたが、単にAI解析を行うのであれば、Googleが提供しているものなど、すでに多数のシステムが存在します。そのなかでNIMSが独自開発することすることの意義は、「材料工学的な視点を取り入れたシステム設計」にあると考えています。たとえば、各データが製造プロセスに関するものなのか、結晶構造に関するものなのか——あらかじめラベリングしておくことによってデータ同士の相関が導きやすくなりますし、他のユーザーへの「提案」にその知見を活かしやすくなります。こうした、材料研究において配慮すべき要件に則った、独特なデータの取り回しを考慮したシステム設計こそ、我々の強みです。

桑島: そして、各システムにおけるデータの取り回し方次第で、データ収集の戦略も変わってきます。たとえば、データに対するラベルのつけ方や、構造化のフォーマットを変える必要が出てきます。ときには、いまある材料データベースだけで本当にいいのかといった、抜本的な見直しを要する場面も出てくるでしょう。だからこそ、この3人で頻繁に議論を交わし、最適なデータ収集方法を模索しています。今後は、論文からのAIを活用したテキストの抽出など、質と効率を両立する新しい手法も積極的に取り入れていきます。
一方で、研究会で講演を行うと実感するのは、研究者によってデータ駆動型研究に関心のある人とない人が明確に分かれていることです。私は、材料開発のDX化とは「文化をつくること」だと捉えています。だから、すでに自分なりの研究スタイルを確立している研究者からすれば、慣れ親しんだやり方を変えるというのは、「異文化を受け入れる」という高いハードルを越えることを意味します。一筋縄ではいかないと感じていますが、より多くの研究者にMDPFのサービスを活用していただき、その有用性を実感していただけるよう、今後もブラッシュアップを続けていきます。

門平:研究成果をデータベースに入力するといった場合、従来にはなかった業務が発生するため、一見、「研究成果を最速で創出する」という目的とは逆の方向に向かっているように感じる人もいるかもしれません。しかし、材料研究DXを着実に進めることで、どこかで前提が変わり、あるとき求めていた研究成果に信じられないようなスピードでたどり着ける日が訪れるのではないか、という期待を抱いています。

源:そのときには、「マテリアルDX」という言葉自体が死語になっているはずですよね。「そんな言葉もあった」と言われる日がくるように、いまは地道にデータ利活用の事例を示し、そのメリットを浸透させていく時期だと捉えています。
さきほど紹介したpinaxにしても、システム設計に材料工学的な工夫を取り込もうと思うと、開発や運用は複雑になります。それに、システムの規模が大きくなるほど、OSのアップデートやサイバー攻撃への対策を講じる際に手間がかかるのも事実です。その点、MDPFは「あえて難しいルートを進んでいる」ともいえます。しかし、そこにこそ、国の研究機関がDX化の中核を担う意味があると思うのです。面倒でもやるべきことをやる——その信念はMDPFのメンバー全員で共有できているものと感じていますし、一丸となって材料開発のDX化を実現したいと強く願っています。