Home
4305 words
22 minutes
【計算化学】自作pythonライブラリで遷移状態構造を求めてみる(BH9データセットの4. Hydrogen atom transfer, No. 6の化学反応, NNP(UMA)使用)

最終更新:2025-11-05

概要#

本記事では、自作ライブラリ(MultiOptPy)で、BH9データセットの4. Hydrogen atom transfer, No. 6の素過程の遷移状態構造を算出してみる。計算レベルは、Meta社のFAIR Chemistryが開発したニューラルネットワークポテンシャル(NNP)であるUMA(Meta’s Universal Model for Atoms)とした。

MultiOptPyは電子状態計算ソフトウェアを用いた分子構造最適化手法の勉強を目的として作成したpythonライブラリである。

MultiOptPyのレポジトリ:https://github.com/ss0832/MultiOptPy

BH9のデータセットについて:

  • J. Chem. Theory Comput. 2022, 18, 1, 151–166

https://doi.org/10.1021/acs.jctc.1c00694

この文献のSupporting Informationから、データセットの詳細を確認できる。

有機金属錯体が関わる反応を除いたさまざまなカテゴリの反応がまとめられたデータセットである。DFTの汎関数の電子エネルギーの精度の比較などのベンチマークに主に使われる。

今回使用したニューラルネットワークポテンシャルについて:

使用した自作ライブラリMultiOptPyのバージョン#

v1.19.3

環境#

Windows 11

※Windows 11環境下でAnaconda PowerShell Promptを使用した。

Source codeのダウンロード(Unixコマンド)#

wget https://github.com/ss0832/MultiOptPy/archive/refs/tags/v1.19.3.zip
unzip v1.19.3.zip
cd MultiOptPy-v1.19.3

https://github.com/ss0832/MultiOptPy/releases/tag/v1.19.3 にアクセスしてzipファイルをダウンロードする。Unixコマンドの場合とはディレクトリ名が異なるので都度読み替えていただけると良い。

移動先のディレクトリでrequirements.txtを参照することで、本ソースコードで必要なモジュールを把握することが出来る。導入方法は各自の状況に合わせて適宜LLMとの対話などで調べると良い。

次に述べる環境構築手順を使用する場合は、環境構築が終わった後、pip install -r requirements.txtで本自作モジュールが動作させるために最低限必要なモジュールを導入することが可能である。

環境構築手順#

今回は、Windows 11のPower Shellを使用した。初めに、NNPを使用できる環境が整ったAnaconda PowerShell Promptを用意する手順を説明する。

1, https://repo.anaconda.com/archive/ より、Anaconda3-2025.06-1-Windows-x86_64.exeでAnacondaをインストールする。

2, 検索機能を使い、スタートからAnaconda PowerShell Promptを開く。

3, 以下のコマンドを実行し、仮想環境を作成する。

conda create -n (任意の仮想環境名) python=3.12.7

4, 先ほど作成した仮想環境をconda activate (仮想環境名)で起動させる。

5, 以下のコマンドを実行し、必要なライブラリを導入する。

pip install ase==3.26.0 fairchem-core==2.7.1 torch==2.6.0
  • fairchem-coreは、FAIR Chemistryが管理しているNNPを動作させるために必要なライブラリである。
  • aseはNNPに電子エネルギーを算出したい分子構造を渡すために必要なインターフェイスの役割を果たすために必要なライブラリである。
  • torchはPyTorchライブラリを指す。これはニューラルネットワークなどの機械学習を行ったり、学習結果を扱ったりするために必須なライブラリである。

これで、Anaconda PowerShell Promptから仮想環境を立ち上げることで、NNPを使用する準備が整えることが出来る。

次に、NNPを使用するために必要なModelの情報が保存されている.ptファイルのダウンロードおよびNNPの自作ライブラリへの導入方法について説明する。

1, 以下のサイトにアクセスして、uma-s-1p1.ptをダウンロードする。(使用許諾が下りていれば可能である。)

https://huggingface.co/facebook/UMA

2, ダウンロード後、MultiOptPy-v1.19.3ディレクトリ内に存在するsoftware_path.confに対して、uma-s-1p1.ptの絶対パスを用いて以下を追記する。

uma-s-1p1::(uma-s-1p1.ptの絶対パス)

これで、MultiOptPy-v1.19.3がNNPuma-s-1p1を使用できるようになる。

使用するNNPに関する具体的な説明#

今回使用するNNPについて具体的に説明する。

  • UMAのModel Checkpointはuma-s-1p1を使用した。
  • 小分子系のトレーニングセットであるOmol25(omol)を使用して学習したニューラルネットワークポテンシャルを使用する。

※自作ライブラリでの具体的な使用の仕方に関しては、ase_calculation_tools.py を参照すると良い。omol以外のモデルを使用したい場合は、現バージョンでは、multioptpy/Calculator/ase_tools/firechem.py内の、self.task_nameを編集することで対応可能である。

手順#

1. 初期構造の準備#

モデル反応系として、以下の構造を用意した。今回はファイルの名前をbh9_4_6.xyzとした。 初期構造は以下のものを使用した。

19
OptimizedStructure
N      0.391165194202      1.646211080523      0.105947666818
C      0.752697394527      0.302205699629      0.623408468988
H      0.576315876192      2.390895568818      0.774563890003
H     -0.620250181108      1.654950107888     -0.166915101966
C      2.024530201272     -0.106720322720     -0.125478458732
H      0.860326246451      0.311660114070      1.704480580957
H     -0.065844927310     -0.392107563125      0.327660980910
O      2.345782542877      0.553246069313     -1.098448078120
N      2.663074620605     -1.193556104891      0.313752308476
H      2.399865988530     -1.672244613228      1.157674358001
C     -1.405405022893     -1.094472621415     -0.754712256037
C     -2.389405391138     -0.131528211235     -0.291989610118
H     -0.725472264449     -0.795957336580     -1.540302142062
H     -1.509946290161     -2.138363576447     -0.496721343732
O     -2.209615525783      1.080704651736     -0.313196499665
O     -3.485566186941     -0.691701326675      0.194056731683
H      3.491602739297     -1.498498474593     -0.173733429547
H     -4.101483629415      0.000972991561      0.484891679101
H      1.007628615245      1.774303867370     -0.724939744958
初期経路を求めるための初期構造

2. 遷移状態構造最適化#

 run_autots.pyを適切に使用することで、自動的に遷移状態構造が得られる。以下にその手順を説明していく。

初期構造をカレントディレクトリにbh9_4_6.xyzとして保存する。その後、同じディレクトリ内で、config_bh9_4_6.jsonを作成し、以下のように記述する。

config_bh9_4_6.json

{
  "work_dir": "bh9_4_6",
  "top_n_candidates": 3,
  
  "step1_settings": {
    "othersoft": "uma-s-1p1",
    "opt_method": ["rsirfo_block_fsb"],
    "use_model_hessian": "fischerd3",
    "spin_multiplicity": 2,
    "electronic_charge": 1
  },
  
  "step2_settings": {
    "othersoft": "uma-s-1p1",
    "NSTEP": 15,
    "ANEB": [3, 5],
    "QSM": true,
    "use_model_hessian": "fischerd3",
    "save_pict": true,
    "node_distance_bernstein": 0.80,
    "align_distances": 9999,
    "spin_multiplicity": 2,
    "electronic_charge": 1
  },
  
  "step3_settings": {
    "othersoft": "uma-s-1p1",
    "opt_method": ["rsirfo_block_bofill"],
    "calc_exact_hess": 5,
    "tight_convergence_criteria": true,
    "max_trust_radius": 0.2,
    "frequency_analysis": true,
    "spin_multiplicity": 2,
    "electronic_charge": 1
  },

  "step4_settings": {
    "othersoft": "uma-s-1p1",
	"opt_method": ["rsirfo_block_bofill"],
    "spin_multiplicity": 2,
    "electronic_charge": 1,
	"calc_exact_hess": 10,
    "tight_convergence_criteria": true,
    "frequency_analysis": true,
    
    "intrinsic_reaction_coordinates": ["0.5", "200", "lqa"],

    "step4b_opt_method": ["rsirfo_block_fsb"]
  }
}

その後、以下のコマンドを実行する。

python run_autots.py bh9_4_6.xyz -cfg config_bh9_4_6.json -ma 250 7 11

これにより、これまでの似た内容の記事で行ってきたコマンドの操作をまとめ、遷移状態構造を求める処理を自動的に行う。

具体的な処理の流れは、

Step1. バイアスポテンシャルによるNEB法のための初期経路の作成

Step2. NEB法による経路の緩和

Step3. NEB法により得られた経路のエネルギー極大値を示す構造のうち、エネルギー値が上位の最大で3個
(`run_autots.py`にて、`--top_n X`で最大値を変更可能)の構造を初期構造とした遷移状態構造の算出

(Step4.得られた遷移状態構造に対するIRC計算とIRC経路の末端に存在する構造に対する構造最適化。
こちらは`--run_step4`をコマンドで追記しなければ行わない。)

となっている。

run_autots.pyのオプションの説明:

  • -cfg YYY.jsonは、
  • -ma yyy a bはyyykJ/molの活性化障壁を超えうるペア同士を近づける力を原子のラベル番号aとbのペアに構造最適化時に加えることを示す。

これらの一連の結果は、(jsonファイルの"work_dir"にて指定した名前)のディレクトリの中に存在するファイルを開いて確認できる。

以下にすべてのstepで共通のオプションに関する説明を載せる。

  • "opt_method": ["rsirfo_block_fsb"]は準ニュートン法であるRS-I-RFO法を構造最適化に使用することを示す。初期のへシアンに関しては、特にオプションで指定しない限り、単位行列が使われる。(以前のHessian更新法とは細かな点で異なる方法を使用している。具体的には、複数の座標変位や勾配変位を用いてHessianの更新を行う。)
  • "spin_multiplicity": Zはスピン多重度の指定である。PySCFを使用するときは目的とするスピン多重度に1を引いた値を指定する。(デフォルトでは1が指定される。)
  • "electronic_charge": 0は形式電荷をMとすることを示す。(デフォルトでは0が指定される。)
  • "othersoft": "uma-s-1p1"は今回使用するNNPを指定している。これを使用する際にASEライブラリが必要である。
  • "use_model_hessian": "fischerd3"は、計算コストが非常に低い数式を使用して、近似したHessianを生成する機能を呼び出すオプションである。デフォルトではこの機能は使用されない。

※オプションの説明はMultiOptPy-v1.19.3/OPTION_README.mdにて示されている。

Step 1#

Step1では、omolのデータセットを使用したuma-s-1p1モデルのNNPで得たエネルギーに対して、指定した人工力ポテンシャルを加えた上で初期構造を構造最適化を行っている。

Step1が正常終了していれば作成されたwork_dirディレクトリ中に、bh9_4_6_step1_traj.xyzが存在する。必要に応じて確認し、目的に沿った初期経路が得られているか確認する。もし想定とは異なる場合は、プロセスをkillして再度設定を見直してやり直す。

bh9_4_6_step1_traj.xyzは構造最適化の過程をAvogadro(公式ページ:https://avogadro.cc/ )等で可視化して確認できるようにしている。このbh9_4_6_step1_traj.xyzはStep2のNEB計算に使用している。

bh9_4_6_step1_traj.xyzをアニメーションとして表示したい場合は、[https://github.com/ss0832/molecule_movie] を使うと良い。

Step 2#

Step2では、NEB法を用いることで、先ほど得られたbh9_4_6_step1_traj.xyz全体のエネルギーを下げることができる。これにより、パスのエネルギー極大値を持つ構造を遷移状態構造に近づける。(この時点ではまだ正確な遷移状態構造は求められていない。)

Step2固有のオプションについて以下に示す。

  • "NSTEP": nはn回分NEB法による経路の緩和を行うことを示す。
  • "align_distances": Xは線形補間で、各ノード間の距離を全て等しくするための処理である。X回の反復計算ごとに本処理を行う。Xを"NSTEP": nよりも大きな数値を指定することで、初期経路に対してのみ処理を行うことが出来る。
  • "node_distance_bernstein": Nはノード間の距離をN Åとして初期経路を作成することを示す。経路作成時に元のノードをベルンシュタイン多項式を用いてがたついた経路を滑らかにする。

→プログラムの仕様上"align_distances": Xの処理を行った後に、"node_distance_bernstein": Nの処理を行うようになっている。

  • "save_pict": trueは緩和中のパスのエネルギープロファイルや各ノードの勾配のRMS値をmatplotlibで可視化するオプションである。
  • "ANEB": [A, B]これを指定すると、(B+1)回の緩和ごとに、エネルギー極大値を示すノードと前後のノードの間に線形補間でA個の新規ノードを内挿するようにできる。デフォルトではこのような操作は行われない。このオプションを使用するとノードの数が徐々に増えるため、計算コストが使用しない場合と比べて増加する。一方で、エネルギー極大値を示すノード周辺にノードを増加させるため、緩和している経路中のノードが遷移状態構造付近に存在する可能性が高くすることが出来る。

MultiOptPy-v1.19.3/"work_dir"と同じディレクトリ内に、NEBという名前を含むディレクトリが生成されている。 そのディレクトリ内のenergy_plot.csvを確認し、緩和後のパスのエネルギー極大値を示す構造を確認する。

経路の緩和後の各ノードのエネルギー一覧(単位) (energy_plot.csvに保存されている。)

NEB計算の結果の可視化
NEB計算の結果の可視化

bias_force_rms.csvにて、各Iterationごとのすべてのノードの勾配のRMS値を確認できる。

経路緩和の結果、以下の構造がstep3の初期構造として用いられることとなった。“work_dir”内のbh9_4_6_step3_TS_Opt_Inputs内に保存されたbh9_4_6_ts_guess_X.xyzにて確認が可能である。ts_guessの番号が小さい順にエネルギー値が高い構造を示すようになっている。

※こちら[https://ss0832.github.io/molecule_viewer/] を使うことでも可視化は可能である。

bh9_4_6_ts_guess_1.xyz

19
1 2
N       0.390495384996      1.648513058493      0.101460189221
C       0.762353624931      0.319569211552      0.599329659071
H       0.573184439926      2.377488541277      0.789973719911
H      -0.620189314182      1.682746817291     -0.183025726836
C       1.996335072052     -0.129437453266     -0.132366886161
H       0.727207685796      0.217126880872      1.675303481273
H      -0.230878623137     -0.455177305637      0.110120180592
O       2.340767510994      0.530683908392     -1.100708570066
N       2.603532358684     -1.238388024271      0.303816762762
H       2.322350194930     -1.717064681657      1.142415496185
C      -1.211662414276     -0.958587140064     -0.625159097992
C      -2.344594761908     -0.084866421228     -0.263154847136
H      -0.790143077528     -0.762171714415     -1.605163043138
H      -1.275094345207     -1.998560293775     -0.337033660619
O      -2.295701070942      1.129217725497     -0.390474636594
O      -3.366305134370     -0.726192117088      0.272688270937
H       3.452622063910     -1.533066933834     -0.154107078358
H      -4.054782824413     -0.085768534419      0.518086133621
H       1.020503229746      1.783934476282     -0.722000346676
NEB法により緩和した経路から得られた遷移状態構造を求めるための初期構造 (No.1)

Step 3#

step3のオプションで、追加での説明を要するものを以下に示す。

  • "opt_method": ["rsirfo_block_bofill"]は遷移状態構造の最適化向けのoptimizerを指定することを意味する。準ニュートン法であるRS-I-RFO法を使用する。今回は-fcで正確なHessianを計算するようにしているので、初期Hessianは正確なHessianを使用するようになっている。(Bofill法によるHessianの更新法を細かい点で変更している。具体的には、複数の座標変位や勾配変位を用いてHessianの更新を行う。)
  • "saddle_order": 1は一次の鞍点を求めることを指定する。(step3のデフォルトでは一次の鞍点を指定する。それ以外の値の指定は、プログラムの使用目的上想定していないので、行わないことを勧める。)
  • "calc_exact_hess": 5は5回の反復回数当たり1回正確なHessianを計算することを指定する。
  • "frequency_analysis": trueは収束条件を満たした後に基準振動解析を行うことを示す。(自前で実装しているため、あくまで目安として使用することを推奨する。各振動モードをvibration_animation内のxyzファイルで可視化できる。)UMAモデルから算出されるHessianは数値微分により求めているため、原子数Zが多いとZの二乗オーダーで計算コストが急増する。
  • "tight_convergence_criteria": trueは収束条件を厳しくすることを示す。(Gaussianのtightと同等)
  • "max_trust_radius": Dは一回の反復計算ごとの計算されるステップ幅の最大値をDÅ以下にすることを示す。デフォルトでは、"saddle_order": 1を指定すると0.1Åが指定される。

実行して得られた正確な遷移状態構造と思われる構造を以下に示す。

(実行して得られた正確な遷移状態構造は計算開始時に、MultiOptPy-v1.19.3/"work_dir"ディレクトリ内に生成された新規ディレクトリ内のbh9_4_6_ts_final_X.xyzとして保存されている。)

bh9_4_6_ts_final_1.xyz

19
OptimizedStructure
N      0.392009440566      1.625485019712      0.121039803801
C      0.787918982408      0.301046075808      0.610693369819
H      0.620044964581      2.372763949397      0.776201270087
H     -0.643990484219      1.645115206690     -0.087820789466
C      2.010364615191     -0.132174429038     -0.154420800575
H      0.753813799532      0.191499762563      1.688253852029
H     -0.193687389675     -0.480752015970      0.144848601629
O      2.278672648958      0.490734459826     -1.170494235163
N      2.677346175894     -1.200044378849      0.296414240714
H      2.471889367076     -1.632797713136      1.180185168936
C     -1.225619612905     -0.968394482999     -0.564028322082
C     -2.346514113168     -0.062896915380     -0.222375886934
H     -0.840131165705     -0.817472951538     -1.568294274965
H     -1.335797548872     -2.005194666978     -0.269556918416
O     -2.231303272221      1.154004380300     -0.197956099762
O     -3.466969524779     -0.686082360542      0.079833982951
H      3.491960772354     -1.509941410262     -0.210709420845
H     -4.154145116690     -0.032972836632      0.296262896078
H      0.954137461676      1.748075307030     -0.748076437834
遷移状態構造 (No.1)

停留点に収束した構造が得られた。-freqオプションにより生成されたnormal_modes.txtvibration_animationディレクトリ内の振動モードのアニメーションを確認した。

以下に-freqオプションで生成されたnormal_modes.txtの一部を示す。

Mode                                 0                   1                   2
Freq [cm^-1]                    -1811.5503             53.7316             60.6195
Reduced mass [au]                   1.1217              3.5547              6.6155
Force const [Dyne/A]               -2.1688              0.0060              0.0143
Char temp [K]                       0.0000             77.3078             87.2180
Normal mode                   x         y         z            x         y         z            x         y         z     
       N                -0.00223   -0.00834   -0.00118    0.00708    0.01283    0.06058    0.01075    0.00889    0.02425
       C                 0.05247    0.03913    0.01448    0.02727    0.01328    0.04470    0.02558    0.01908    0.04043
       H                -0.01845   -0.00145    0.00713   -0.03335    0.00792    0.07930    0.06287    0.02711   -0.01493
       H                -0.02787   -0.02176   -0.00010    0.01412   -0.01091    0.02078   -0.00260    0.01176    0.08337
       C                -0.01058   -0.00371    0.00008   -0.00855    0.01316   -0.01537   -0.01645   -0.01148   -0.00656
       H                -0.10116   -0.06790   -0.00929    0.08971    0.01678    0.04701    0.06231    0.04198    0.04377
       H                -0.69599   -0.43957   -0.40150    0.00957    0.00277    0.10579    0.01601    0.02030    0.07246
       O                -0.00040    0.00134   -0.00077   -0.02778    0.04453   -0.00119   -0.10716   -0.08857   -0.07823
       N                -0.00043   -0.00058    0.00089   -0.02075   -0.02232   -0.08166    0.04360    0.04255    0.03241
       H                -0.00041   -0.00304    0.00014    0.00147   -0.04908   -0.08954    0.12140    0.11174    0.08437
       C                 0.05420    0.02009    0.03373    0.01297   -0.06908    0.14573    0.03514    0.02554    0.03014
       C                -0.00553    0.00044   -0.00156    0.00972   -0.01504   -0.00304    0.01222    0.00800    0.00515
       H                -0.11197   -0.04913   -0.05003    0.03902   -0.19871    0.13597    0.06981    0.04508    0.04600
       H                -0.06771   -0.00374   -0.06912   -0.01161   -0.03184    0.26834    0.03216    0.01906    0.00642
       O                -0.00071   -0.00002    0.00044    0.03316   -0.01578   -0.08901    0.00922    0.00679    0.08529
       O                 0.00014    0.00149   -0.00127   -0.02827    0.03401   -0.04395   -0.01073   -0.00953   -0.11914
       H                 0.00237    0.00249    0.00266   -0.04258   -0.01868   -0.11897    0.01038    0.01740   -0.00559
       H                -0.00121   -0.00049   -0.00252   -0.03027    0.06650   -0.14800   -0.02680   -0.02282   -0.12968
       H                -0.00337   -0.00229   -0.00461    0.02393    0.03768    0.07303   -0.04884   -0.02696   -0.01820
       
(...snip...)

その結果、虚振動が1つであることが確認できた。つまりこの構造は遷移状態構造である。

次に、vibration_animation内の虚振動を示す分子振動が示されたxyzファイル(mode_1_XXXi_wave_number.xyz)をAvogadroで確認すると、求められた遷移状態構造の中に、想定される反応系と生成系をつなぐ方向に振動している構造が存在することを確認できた。

終わりに#

   自作ライブラリで、UMAモデルのニューラルネットワークポテンシャル(NNP, uma-s-1p1)を用いて、BH9データセットの4. Hydrogen atom transfer, No. 6の反応のある1つの遷移状態構造を算出する手順を説明した。

参考#

【計算化学】自作pythonライブラリで遷移状態構造を求めてみる(BH9データセットの4. Hydrogen atom transfer, No. 6の化学反応, NNP(UMA)使用)
https://ss0832.github.io/posts/20251105_mop_usage_bh9_4_6/
Author
ss0832
Published at
2025-11-05