最終更新:2025-11-27
概要
本記事では、自作ライブラリ(MultiOptPy)で、BH9データセットの2. Pericyclic, No. 136の素過程の遷移状態構造を算出してみる。計算レベルは、Meta社のFAIR Chemistryが開発したニューラルネットワークポテンシャル(NNP)であるUMA(Meta’s Universal Model for Atoms)とした。
MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonライブラリである。
MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy
BH9のデータセットについて:
- J. Chem. Theory Comput. 2022, 18, 1, 151–166
https://doi.org/10.1021/acs.jctc.1c00694
この文献のSupporting Informationから、データセットの詳細を確認できる。
有機金属錯体が関わる反応を除いたさまざまなカテゴリの反応がまとめられたデータセットである。DFTの汎関数の電子エネルギーの精度の比較などのベンチマークに主に使われる。
今回使用したニューラルネットワークポテンシャルについて:
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
- arXiv preprint arXiv:2505.08762 (2025). (プレプリント)
使用した自作ライブラリMultiOptPyのバージョン
v1.20.0-rc.1環境
Windows 11※Windows 11環境下でAnaconda PowerShell Promptを使用した。
Source codeのダウンロード(Unixコマンド)
wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.20.0-rc.1.zip
unzip v1.20.0-rc.1.zip
cd MultiOptPy-v1.20.0-rc.1https://github.com/ss0832/MultiOptPy/releases/tag/v1.20.0-rc.1 にアクセスしてzipファイルをダウンロードする。Unixコマンドの場合とはディレクトリ名が異なるので都度読み替えていただけると良い。
移動先のディレクトリでrequirements.txtを参照することで、本ソースコードで必要なモジュールを把握することが出来る。導入方法は各自の状況に合わせて適宜LLMとの対話などで調べると良い。
次に述べる環境構築手順を使用する場合は、環境構築が終わった後、pip install -r requirements.txtで本自作モジュールが動作させるために最低限必要なモジュールを導入することが可能である。
環境構築手順
今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。
1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exeでAnacondaをインストールする。
2, 検索機能を使い、スタートからAnaconda PowerShell Promptを開く。
3, 以下のコマンドを実行し、仮想環境を作成する。
conda create -n (任意の仮想環境名) python=3.12.74, 先ほど作成した仮想環境をconda activate (仮想環境名)で起動させる。
5, 以下のコマンドを実行し、必要なライブラリを導入する。
pip install ase==3.26.0 fairchem-core==2.7.1 torch==2.6.0- fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
- aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
- torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。
これで、Anaconda PowerShell Promptから仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。
次に、NNPを使用するために必要なModelの情報が保存されている.ptファイルのダウンロードおよびNNPの自作ライブラリへの導入方法について説明する。
1, 以下のサイトにアクセスして、uma-s-1p1.ptをダウンロードする。(使用許諾が下りていれば可能である。)
https://huggingface.co/facebook/UMA2, ダウンロード後、MultiOptPy-v1.20.0-rc.1ディレクトリ内に存在するsoftware_path.confに対して、uma-s-1p1.ptの絶対パスを用いて以下を追記する。
uma-s-1p1::(uma-s-1p1.ptの絶対パス)これで、MultiOptPy-v1.20.0-rc.1がNNPuma-s-1p1を使用できるようになる。
使用するNNPに関する具体的な説明
今回使用するNNPについて具体的に説明する。
- UMAのModel Checkpointは
uma-s-1p1を使用した。 - 小分子系のトレーニングセットである
Omol25(omol)を使用して学習したニューラルネットワークポテンシャルを使用する。
※自作ライブラリでの具体的な使用の仕方に関しては、ase_calculation_tools.py を参照すると良い。omol以外のモデルを使用したい場合は、現バージョンでは、multioptpy/Calculator/ase_tools/firechem.py内の、self.task_nameを編集することで対応可能である。
手順
1. 初期構造の準備
モデル反応系として、以下の構造を用意した。今回はファイルの名前をbh9_2_136.xyzとした。 初期構造は以下のものを使用した。
19
OptimizedStructure
O -1.373644687299 -0.868537018908 -0.601218556488
C -2.559030621458 -0.314838901434 -0.257484251145
C -2.794973461980 0.674190908093 0.597959555412
C 1.485259833691 1.350941424135 -0.405105277850
C 0.214009688566 0.968767012516 -0.504940201892
C -0.204453420445 -0.369301618426 0.045146509231
C 2.488335512321 0.447065430084 0.171133676675
C 2.221356763445 -0.852610244237 0.289687470759
C 0.890482495781 -1.400597616619 -0.149946584000
H 3.456342185984 0.842807182109 0.450639674143
H 2.973853876494 -1.542218052727 0.650833415129
H 0.938033126266 -1.662081092284 -1.215349277380
H 0.634583394504 -2.310953881653 0.391740738600
H -3.363149047331 -0.803811852911 -0.793119759182
H -2.021721327036 1.199622169669 1.138760600641
H -3.818573698305 0.977022350834 0.758739729446
H -0.416113880973 -0.270525096405 1.119528460100
H 1.797416779828 2.326920843290 -0.755287367287
H -0.548013512054 1.608138054874 -0.9317185549142. 遷移状態構造最適化
run_autots.pyを適切に使用することで、自動的に遷移状態構造が得られる。以下にその手順を説明していく。
初期構造をカレントディレクトリにbh9_2_136.xyzとして保存する。その後、同じディレクトリ内で、config_bh9_2_136.jsonを作成し、以下のように記述する。
config_bh9_2_136.json
{
"work_dir": "bh9_2_136",
"top_n_candidates": 3,
"multioptpy_version": "1.20.0-rc.1",
"step1_settings": {
"othersoft": "uma-s-1p1",
"opt_method": ["rsirfo_block_fsb"],
"use_model_hessian": "fischerd3",
"spin_multiplicity": 1,
"electronic_charge": 0,
"manual_AFIR": ["350", "4,18", "3,15,16"]
},
"step2_settings": {
"othersoft": "uma-s-1p1",
"NSTEP": 15,
"ANEB": [3, 5],
"QSM": true,
"use_model_hessian": "fischerd3",
"save_pict": true,
"node_distance_bernstein": 0.50,
"align_distances": 9999,
"spin_multiplicity": 1,
"electronic_charge": 0
},
"step3_settings": {
"othersoft": "uma-s-1p1",
"opt_method": ["rsirfo_block_bofill"],
"calc_exact_hess": 5,
"tight_convergence_criteria": true,
"max_trust_radius": 0.2,
"frequency_analysis": true,
"NSTEP": 500,
"detect_negative_eigenvalues": true,
"spin_multiplicity": 1,
"electronic_charge": 0
},
"step4_settings": {
"othersoft": "uma-s-1p1",
"opt_method": ["rsirfo_block_bofill"],
"spin_multiplicity": 1,
"electronic_charge": 0,
"calc_exact_hess": 10,
"tight_convergence_criteria": true,
"frequency_analysis": true,
"intrinsic_reaction_coordinates": ["0.5", "200", "lqa"],
"step4b_opt_method": ["rsirfo_block_fsb"]
}
}その後、以下のコマンドを実行する。
python run_autots.py bh9_2_136.xyz -cfg config_bh9_2_136.jsonこれにより、これまでの似た内容の記事で行ってきたコマンドの操作をまとめ、遷移状態構造を求める処理を自動的に行う。
具体的な処理の流れは、
Step1. バイアスポテンシャルによるNEB法のための初期経路の作成
Step2. NEB法による経路の緩和
Step3. NEB法により得られた経路のエネルギー極大値を示す構造のうち、エネルギー値が上位の最大で3個
(`run_autots.py`にて、`--top_n X`で最大値を変更可能)の構造を初期構造とした遷移状態構造の算出
(Step4.得られた遷移状態構造に対するIRC計算とIRC経路の末端に存在する構造に対する構造最適化。
こちらは`--run_step4`をコマンドで追記しなければ行わない。)となっている。
run_autots.pyのオプションの説明:
-cfg YYY.jsonは、workflowを実行するためのオプションが記されたJSONファイルの読み込み先を指定する。
これらの一連の結果は、(jsonファイルの"work_dir"にて指定した名前)のディレクトリの中に存在するファイルを開いて確認できる。
以下にすべてのstepで共通のオプションに関する説明を載せる。
"opt_method": ["rsirfo_block_fsb"]は準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。(以前のHessian更新法とは細かな点で異なる方法を使用している。具体的には、複数の座標変位や勾配変位を用いてHessianの更新を行う。)"spin_multiplicity": Zはスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)"electronic_charge": 0は形式電荷をMとすることを示す。(デフォルトでは0が指定される。)"othersoft": "uma-s-1p1"は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。"use_model_hessian": "fischerd3"は、計算コストが非常に低い数式を使用して、近似したHessianを生成する機能を呼び出すオプションである。デフォルトではこの機能は使用されない。
※オプションの説明はMultiOptPy-v1.20.0-rc.1/OPTION_README.mdにて示されている。
Step 1
Step1では、omolのデータセットを使用したuma-s-1p1モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化を行っている。
以下のJSON内で記述したバイアスポテンシャルで、次の経路緩和アルゴリズムの初期経路として用いるトラジェクトリーを生成する。
"manual_AFIR": ["yyy", "a", "b]:yyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号aとbのペアに構造最適化時に加えることを示す。
Step1が正常終了していれば作成されたwork_dirディレクトリ中に、bh9_2_136_step1_traj.xyzが存在する。必要に応じて確認し、目的に沿った初期経路が得られているか確認する。もし想定とは異なる場合は、プロセスをkillして再度設定を見直してやり直す。
bh9_2_136_step1_traj.xyzは構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このbh9_2_136_step1_traj.xyzはStep2のNEB計算に使用している。
※bh9_2_136_step1_traj.xyzをアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。
Step 2
Step2では、NEB法を用いることで、先ほど得られたbh9_2_136_step1_traj.xyz全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)
Step2固有のオプションについて以下に示す。
"NSTEP": nはn回分NEB法による経路の緩和を行うことを示す。"align_distances": Xは線形補間で、各ノード間の距離を全て等しくするための処理である。X回の反復計算ごとに本処理を行う。Xを"NSTEP": nよりも大きな数値を指定することで、初期経路に対してのみ処理を行うことが出来る。"node_distance_bernstein": Nはノード間の距離をN Åとして初期経路を作成することを示す。経路作成時に元のノードをベルンシュタイン多項式を用いてがたついた経路を滑らかにする。
→プログラムの仕様上"align_distances": Xの処理を行った後に、"node_distance_bernstein": Nの処理を行うようになっている。
"save_pict": trueは緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。"ANEB": [A, B]これを指定すると、(B+1)回の緩和ごとに、エネルギー極大値を示すノードと前後のノードの間に線形補間でA個の新規ノードを内挿するようにできる。デフォルトではこのような操作は行われない。このオプションを使用するとノードの数が徐々に増えるため、計算コストが使用しない場合と比べて増加する。一方で、エネルギー極大値を示すノード周辺にノードを増加させるため、緩和している経路中のノードが遷移状態構造付近に存在する可能性が高くすることが出来る。
MultiOptPy-v1.20.0-rc.1/"work_dir"と同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csvを確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。
経路の緩和後の各ノードのエネルギー一覧(単位
※bias_force_rms.csvにて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。
経路緩和の結果、以下の構造がstep3の初期構造として用いられることとなった。“work_dir”内のbh9_2_136_step3_TS_Opt_Inputs内に保存されたbh9_2_136_ts_guess_X.xyzにて確認が可能である。ts_guessの番号が小さい順にエネルギー値が高い構造を示すようになっている。
※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。
bh9_2_136_ts_guess_1.xyz
19
0 1
O -1.603983597395 -1.063388987152 -0.675938590661
C -2.319536458588 -0.125932161630 0.046523092558
C -1.801848736495 0.882349435258 0.774640582447
C 0.853001183404 1.337450265218 -0.353384663055
C 0.048786727996 0.592746063013 -1.122076266040
C -0.245708875099 -0.712034752872 -0.457944727530
C 1.700949880438 0.596786922390 0.572615986503
C 1.905300871984 -0.728184711528 0.418073682903
C 0.973352690077 -1.606748487868 -0.424016058276
H 2.304695108929 1.150616222284 1.277996228433
H 2.729318315634 -1.197952195290 0.937756774899
H 1.400466448157 -1.870733569245 -1.396781259959
H 0.764334911869 -2.532626966568 0.116594741226
H -3.382451886181 -0.305427817321 -0.054348492696
H -0.744184196295 1.204123908269 0.715390170163
H -2.517405248017 1.475903583019 1.325004537002
H -0.290670796328 -0.465034908046 0.604288128766
H 0.879004232502 2.414596346224 -0.441367293524
H -0.653420576593 0.953491811847 -1.863026573158bh9_2_136_ts_guess_2.xyz
19
0 1
O -1.603067981520 -1.063684338473 -0.670479998565
C -2.328045659114 -0.128540110533 0.045802650264
C -1.818302917300 0.882638948611 0.774462562198
C 0.863873973052 1.338988740149 -0.371806218105
C 0.048543287430 0.595207504926 -1.118205797002
C -0.245612504215 -0.709406551370 -0.450098047791
C 1.710895482471 0.595653567146 0.568290698680
C 1.910139721409 -0.730335419587 0.416597085932
C 0.973995297323 -1.605033252382 -0.424478530246
H 2.316368678868 1.148015719703 1.274481473007
H 2.738293525112 -1.202400905401 0.928650898256
H 1.397230851790 -1.866708304525 -1.398843025321
H 0.767198710841 -2.531738768724 0.116798783445
H -3.389572152604 -0.311888551892 -0.058131822239
H -0.757594135085 1.201902947516 0.729024811161
H -2.537577057062 1.481799669953 1.314280158099
H -0.286731317968 -0.468185265833 0.612939129950
H 0.890400123247 2.416442852331 -0.430201438370
H -0.650435926675 0.957271518387 -1.859083373351bh9_2_136_ts_guess_3.xyz
19
0 1
O -1.610075250018 -1.071404339215 -0.659492868347
C -2.328339758461 -0.139314273034 0.068863573633
C -1.822184169579 0.894187531281 0.751325582919
C 0.869061758707 1.335365104985 -0.362778619456
C 0.044076591435 0.592667594129 -1.117102765924
C -0.248055817762 -0.717928986310 -0.458179904996
C 1.704930167300 0.589449828682 0.571751334917
C 1.897401225351 -0.735821907365 0.428924726350
C 0.980248270224 -1.602838806521 -0.441271468252
H 2.288756002457 1.147033669599 1.294832916686
H 2.701455367170 -1.213983716305 0.969973310968
H 1.424153325939 -1.837376018067 -1.414025234702
H 0.780058014759 -2.540984139791 0.079944140417
H -3.385910461647 -0.340092323464 0.024758689449
H -0.802178840637 1.216143720298 0.639935744251
H -2.478047611622 1.527449356038 1.317291835921
H -0.276630699473 -0.476335621216 0.606340221003
H 0.890907420608 2.413863787055 -0.417433766203
H -0.629625534751 0.959919539222 -1.883657448631Step 3
step3のオプションで、追加での説明を要するものを以下に示す。
"opt_method": ["rsirfo_block_bofill"]は遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fcで正確なHessianを計算するようにしているので、初期Hessianは正確なHessianを使用するようになっている。(Bofill法によるHessianの更新法を細かい点で変更している。具体的には、複数の座標変位や勾配変位を用いてHessianの更新を行う。)"saddle_order": 1は一次の鞍点を求めることを指定する。(step3のデフォルトでは一次の鞍点を指定する。それ以外の値の指定は、プログラムの使用目的上想定していないので、行わないことを勧める。)"calc_exact_hess": 5は5回の反復回数当たり1回正確なHessianを計算することを指定する。"frequency_analysis": trueは収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。"tight_convergence_criteria": trueは収束条件を厳しくすることを示す。(Gaussianのtightと同等)"max_trust_radius": Dは一回の反復計算ごとの計算されるステップ幅の最大値をDÅ以下にすることを示す。デフォルトでは、"saddle_order": 1を指定すると0.1Åが指定される。"detect_negative_eigenvalues": trueは、初めの計算時(ITR. 0)に、任意の次数の鞍点(遷移状態構造等)を求める際に、正確なへシアンから算出した固有値に1つも負の固有値がない場合、計算を打ち切るオプションである。
実行して得られた正確な遷移状態構造と思われる構造を以下に示す。
(実行して得られた正確な遷移状態構造は計算開始時に、MultiOptPy-v1.20.0-rc.1/"work_dir"ディレクトリ内に生成された新規ディレクトリ内のbh9_2_136_ts_final_X.xyzとして保存されている。)
次に、vibration_animation内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz)をAvogadroで確認すると、求められた遷移状態構造の中に、想定される反応系と生成系をつなぐ方向に振動している構造が存在することを確認できなかった。バイアスポテンシャルをフラグメント(複数の原子の集まり)で指定したためか、C-C結合をうまく形成するように初期経路を作る方向に誘導できなかった。
終わりに
自作ライブラリで、UMAモデルのニューラルネットワークポテンシャル(NNP, uma-s-1p1)を用いて、BH9データセットの2. Pericyclic, No. 136の反応のある1つの遷移状態構造を算出する手順の失敗例を解説した。
参考
- https://github.com/ss0832/MultiOptPy (自作ライブラリMultiOptPyのレポジトリ)
- https://avogadro.cc/ (Avogadro、分子構造可視化ツール)
- https://ai.meta.com/blog/meta-fair-science-new-open-source-releases/ (UMAの公開に関する記事)
- https://github.com/facebookresearch/fairchem (FAIR Chemistryの提供するGitHubのレポジトリ)
- https://fair-chem.github.io/ (同上のレポジトリの内容に関して説明したサイト)
- https://huggingface.co/facebook/UMA (NNPの配布サイト, Hugging Faceへのアカウント登録と配布元の使用許諾が必要である。)
- arXiv preprint arXiv:2505.08762 (2025). (プレプリント)
- The Journal of Chemical Physics 2010, 132, 241102.
- The Journal of Chemical Physics 1991, 94, 751–760.
- In Classical and Quantum Dynamics in Condensed Phase Simulations; WORLD SCIENTIFIC: LERICI, Villa Marigola, 1998; pp 385–404.
- The Journal of Chemical Physics, 2020, 153, 024109.
- The Journal of Chemical Physics, 2022, 144, 214108.
- J. Phys. Chem. A 2019, 123, 3761−3781 http://dx.doi.org/10.1021/acs.jpca.9b01546 (MOBH35のデータセットについて)
