Series B / In Silico Methods
インシリコソフトウェア入門
OpenMM、ORCA、可視化、スラブ界面作成まで
本稿は、バイオマテリアル研究者がインシリコ手法を学ぶためのソフトウェア地図である。OpenMMでタンパク質やペプチドの分子動力学を行う、ORCAで有機分子や金属錯体のDFT計算や振動解析を行う、PyMOLやVMDで構造を可視化する、ASEやpymatgenで結晶スラブや界面モデルを作る、といった使い分けを論文ベースで整理する。
要旨
インシリコ研究では、ソフトウェアを「何でもできる万能ツール」として選ぶのではなく、スケールと問いで選ぶ必要がある。タンパク質、ペプチド、水、脂質、表面近傍の分子揺らぎを見たいならOpenMMなどの古典分子動力学が入口になる。有機分子の電子状態、FTIR、反応性、電荷分布、金属錯体を見たいならORCAなどの量子化学計算が向く。結晶表面やスラブを作りたいならpymatgenやASE、溶媒や分子を詰めたいならPackmol、構造を見せたいならPyMOL、VMD、ChimeraX、Mol*が候補になる。
図1. インシリコソフトウェアの使い分け
1. まず、スケールを分けて考える
インシリコ研究を始めるときに最初に混乱するのは、同じ「分子を計算する」でも、ソフトウェアごとに見ているスケールが違うことである。量子化学計算は、電子状態、結合、電荷、振動、反応性を見る。分子動力学は、原子や粗視化粒子の時間発展、揺らぎ、拡散、結合安定性を見る。結晶・材料計算では、周期境界条件、スラブ、表面、欠陥、吸着を扱う。可視化ソフトは、計算そのものよりも構造の確認、論文図、相互作用の理解に使う。
バイオマテリアル研究では、これらのスケールが混ざる。たとえば、ペプチドがHA表面に吸着する現象を考えると、ペプチドの配座や水和はMDで見たい。表面官能基の電子状態や振動スペクトルはDFTで見たい。HA結晶面や欠陥はスラブモデルで作りたい。得られた構造はPyMOLやVMDで可視化したい。このため、ソフトウェアは一つに絞るのではなく、研究の問いごとに組み合わせる。
2. OpenMM: タンパク質・ペプチド・水和のMD
OpenMMは、高性能で拡張性の高い分子動力学シミュレーションツールキットである。PLOS Computational BiologyのOpenMM 7論文では、OpenMMが新しい力場、積分法、シミュレーションプロトコルを追加しやすく、CPUやGPU上で高性能に動作することが強調されている。OpenMM 8では、機械学習ポテンシャルへの対応も進んでいる。
OpenMMでできることは、主に古典分子動力学である。タンパク質、ペプチド、リガンド、水、イオン、脂質膜などを力場に基づいて動かし、時間発展を観察する。たとえば、ペプチドが水中でどのような配座を取るか、タンパク質の柔らかいループがどう揺らぐか、リガンドが結合ポケット内でどれくらい安定か、塩濃度や温度で構造がどう変わるかを調べられる。
バイオマテリアル研究での応用としては、細胞接着ペプチド、抗菌ペプチド、タンパク質吸着、表面近傍水、ハイドロゲル内の低分子拡散、ポリマー鎖の配座などが考えられる。ただし、OpenMMだけで無機結晶表面や化学反応を正確に扱うのは難しい。古典力場が必要であり、表面やイオン置換材料ではパラメータ化の妥当性が課題になる。
OpenMMを使うときの第一歩は、PDB構造を用意し、力場を選び、水とイオンを入れ、エネルギー最小化、平衡化、本計算を行うことである。タンパク質やペプチドなら、AMBERやCHARMM系の力場が使われることが多い。材料表面との相互作用を扱う場合は、既存力場の適用範囲を慎重に確認する必要がある。
3. ORCA: DFT、振動解析、FTIR、電荷分布
ORCAは、DFT、TD-DFT、半経験的手法、多体摂動、結合クラスター、多参照法などを含む汎用量子化学プログラムである。ORCA 5.0のソフトウェア論文では、幅広い電子状態計算、効率的なDFT、分光、磁気特性、局所相関手法などが整理されている。ORCAは単一のテキスト入力ファイルで計算を指定でき、比較的始めやすい量子化学ソフトとして広く使われている。
ORCAでできることは、分子の電子状態を見ることである。構造最適化、振動数計算、IRスペクトル予測、ラマン、UV-Vis、電荷解析、スピン状態、金属錯体、反応経路、遷移状態探索などが対象になる。たとえば、有機分子のFTIRピークを帰属したい、表面修飾分子の官能基の振動を理解したい、金属錯体の電子状態を見たい、低分子の電荷分布を比較したい、という場合に向く。
バイオマテリアル研究では、ORCAは小分子、表面修飾剤、モノマー、架橋剤、薬剤、リン酸基を含むモデル分子、錯体モデルの解析に使いやすい。たとえば、FTIRで観測されたカルボニル、リン酸、アミド、シラノール、ヒドロキシルのピークを、DFT振動解析で解釈する。あるいは、表面修飾分子の電荷分布や双極子モーメントを比較し、表面吸着や水和の傾向を議論する。
ただし、ORCAは基本的に分子系の量子化学計算であり、周期的な結晶スラブ全体を扱う用途には向かない。結晶表面や周期境界条件を本格的に扱うなら、VASP、Quantum ESPRESSO、CP2K、GPAW、OpenMXなどの周期系コードを検討する。ORCAは、表面そのものではなく、表面官能基や吸着分子の小さなモデルを理解する道具として使うとよい。
4. PyMOL、VMD、ChimeraX、Mol*: 構造を見る、伝える
PyMOLは、タンパク質、リガンド、核酸、表面、結合部位の可視化に広く使われる分子グラフィックスシステムである。高品質な図を作りやすく、PDB構造の確認、色分け、表面表示、リガンド結合部位の可視化に向いている。オープンソース版の基盤も公開されており、Pythonスクリプトによる自動化も可能である。
VMDは、Visual Molecular Dynamicsの名の通り、分子動力学トラジェクトリの可視化と解析に強い。1996年のVMD論文以来、MDシミュレーションの構造表示、軌跡表示、距離・角度解析、密度表示などで広く使われてきた。OpenMMやNAMD、GROMACSなどのMD結果を可視化する際に便利である。
UCSF ChimeraXは、分子構造、密度マップ、3D顕微鏡データなどを扱える次世代可視化ツールである。クライオEM、タンパク質複合体、構造比較、密度マップとの重ね合わせに強い。Mol*は、Webベースの分子可視化エンジンで、大規模な構造データをブラウザ上で高速に表示できる。会員向けWeb教材に構造ビューアを組み込みたい場合には、Mol*のようなWeb系ツールが候補になる。
可視化ソフトは計算結果を飾るだけの道具ではない。構造を見て、異常な結合、欠損残基、重なった原子、向きの違い、表面の粗さ、吸着位置を確認することは、計算の品質管理そのものである。インシリコ研究では、必ず可視化を挟むべきである。
5. AvogadroとOpen Babel: 分子を作る、変換する
Avogadroは、分子編集、可視化、計算入力作成に使えるオープンソースの分子エディタである。Journal of Cheminformaticsの論文では、計算化学、分子モデリング、バイオインフォマティクス、材料科学で使えるクロスプラットフォームの編集・可視化基盤として紹介されている。初心者が有機分子を描き、構造最適化し、ORCAや他の量子化学ソフトの入力を作る入口として有用である。
Open Babelは、分子ファイル形式の変換や簡単な構造処理に使われる。SMILES、SDF、MOL2、PDBなどを変換し、ワークフローの橋渡しをする。インシリコ研究では、ファイル形式の違いが大きな障壁になるため、変換ツールの存在は重要である。Avogadroで分子を作り、Open Babelで形式変換し、ORCAで計算し、PyMOLやVMDで見る、という流れは初学者にも分かりやすい。
6. ASEとpymatgen: 結晶、スラブ、界面を作る
結晶表面やスラブ界面を作りたい場合、ASEとpymatgenは非常に重要である。ASEはAtomistic Simulation Environmentの略で、原子構造を作成し、計算コードへ渡し、結果を解析するためのPython環境である。表面スラブを作り、真空層を入れ、吸着分子を置き、DFTコードへ入力を渡す用途に使える。
pymatgenは、Materials Projectを含む材料データ解析で広く使われるPythonライブラリであり、結晶構造、相図、欠陥、表面、スラブ、Wulff形状などを扱える。Nature Reviews Physicsのpymatgenレビューでは、材料スクリーニングやデータ解析におけるpymatgenの役割が整理されている。表面エネルギーのデータセットやスラブ生成にもpymatgenが使われている。
バイオマテリアル研究でスラブを作りたい場面は多い。ハイドロキシアパタイトの特定結晶面、チタン酸化物表面、ジルコニア表面、リン酸カルシウム表面を作り、水、イオン、ペプチド、低分子の吸着を調べたい場合である。pymatgenやASEでスラブを作り、表面に分子を配置し、必要に応じてDFT、古典MD、機械学習ポテンシャルへ渡す。
注意点として、スラブ作成はボタン一つで正しいモデルが出るわけではない。表面終端、真空層厚さ、スラブ厚さ、電荷補償、双極子、表面再構成、プロトン化状態、水和状態を考える必要がある。特にHAのようなイオン性・水酸基を含む結晶では、表面モデルの妥当性が結果に大きく影響する。スラブ生成ツールは便利だが、化学的判断が必要である。
7. Packmol: 分子を詰める、界面を作る
Packmolは、指定した領域に分子を重なりなく配置するためのツールである。水、イオン、ポリマー、ペプチド、低分子を箱や球、層状領域に詰めることができる。スラブ表面の上に水層を置く、溶媒中にペプチドを入れる、膜やミセルに分子を配置する、といった初期構造作成に使われる。PACKMOL-GUIのようにVMDと統合したGUIも提案されている。
界面シミュレーションでは、初期構造作成が地味に難しい。スラブ、溶媒、イオン、分子、ペプチドが重ならないように置き、密度や距離を調整し、境界条件を考える必要がある。Packmolはこの初期配置を助ける。OpenMMやGROMACS、LAMMPSへ渡す前の構造作成に使うとよい。
8. どの問いにどのソフトを使うか
タンパク質やペプチドの揺らぎを見たいならOpenMM、GROMACS、NAMDなどのMDソフトが候補になる。OpenMMはPythonから扱いやすく、カスタム力やGPU計算にも強い。ペプチドが表面近傍でどう動くか、低分子がポケットに留まるか、水和構造がどう変わるかを見るのに向く。
有機分子のFTIR、電荷分布、分子軌道、反応性を見たいならORCAが候補になる。表面修飾分子、モノマー、架橋剤、薬剤、官能基モデルの量子化学計算に向く。結晶表面全体ではなく、小さな分子モデルやクラスターで議論したいときに使いやすい。
結晶スラブや表面を作りたいならpymatgenやASEが候補になる。結晶構造から特定のMiller指数の表面を切り出し、真空層を入れ、表面エネルギーや吸着モデルを作る。周期DFTや古典MDに渡す前処理に使う。
構造を見たい、論文図を作りたい、相互作用を確認したいならPyMOL、VMD、ChimeraX、Mol*が候補になる。PyMOLは論文図、VMDはMD軌跡、ChimeraXは構造・密度マップ、Mol*はWeb表示に向く。
図2. バイオマテリアル研究でのワークフロー例
9. バイオマテリアル研究への応用例
例1は、細胞接着ペプチドの配座解析である。PyMOLやChimeraXでペプチド構造を確認し、OpenMMで水中MDを行い、配座分布や二次構造傾向を見る。必要に応じて表面モデルを作り、ペプチドの吸着配置を初期構造として試す。ここではOpenMMが揺らぎを、可視化ソフトが構造解釈を担う。
例2は、表面修飾分子のFTIR帰属である。Avogadroで分子を作り、ORCAで構造最適化と振動解析を行い、計算IRスペクトルを実測FTIRと比較する。リン酸基、カルボキシル基、アミド、シラノール、ヒドロキシルのピーク帰属に役立つ。実測スペクトルの解釈を補助するものであり、計算値をそのまま実測値と同一視してはいけない。
例3は、HAやTiO2表面への分子吸着モデルである。pymatgenやASEで結晶スラブを作り、Packmolや手動配置で水や分子を配置し、DFTまたはMDへ渡す。表面終端、プロトン化、水和、電荷補償を慎重に扱う必要がある。単純なスラブモデルは便利だが、実際の材料表面の欠陥、粗さ、水和層を完全には表現しない。
例4は、論文図と教育コンテンツ作成である。PyMOL、VMD、ChimeraX、Mol*を使って、タンパク質、ペプチド、材料表面、吸着分子を視覚的に示す。会員向け動画や資料では、計算結果を見せるだけでなく、どのソフトで何を計算し、どこまで解釈できるかを明示することが重要である。
10. まとめ
インシリコ研究では、ソフトウェア名を覚えるより、問いとスケールを整理することが重要である。OpenMMはタンパク質、ペプチド、水和、分子揺らぎのMDに向く。ORCAは有機分子、錯体、FTIR、電荷、電子状態の量子化学計算に向く。PyMOL、VMD、ChimeraX、Mol*は構造確認と可視化に向く。Avogadroは分子作成の入口として使いやすい。ASEとpymatgenは結晶、表面、スラブ作成に役立つ。Packmolは界面や溶媒系の初期構造作成を助ける。
バイオマテリアル研究では、これらを一つの流れとして組み合わせる。分子を作る、電子状態を見る、スラブを作る、分子を配置する、MDで動かす、可視化する、実験結果と比較する。この流れを会員向けに具体的なチュートリアルとして整備すれば、AI for ScienceやDRY/WET閉ループの実装にもつながる。
参考文献・参考資料
- OpenMM 7: Rapid development of high performance algorithms for molecular dynamics. PLOS Computational Biology.
- OpenMM 8: Molecular Dynamics Simulation with Machine Learning Potentials. arXiv.
- The ORCA quantum chemistry program package. WIREs Computational Molecular Science.
- ORCA overview. Quantum Chemistry Network.
- PyMOL Molecular Graphics System
- VMD: Visual molecular dynamics. Journal of Molecular Graphics.
- UCSF ChimeraX: Meeting modern challenges in visualization and analysis.
- Mol* Viewer: modern web app for 3D visualization and analysis of large biomolecular structures.
- Avogadro: an advanced semantic chemical editor, visualization, and analysis platform.
- Materials discovery screening with pymatgen. Nature Reviews Physics.
- Surface energies of elemental crystals. Scientific Data.
- PACKMOL-GUI: An All-in-One VMD Interface for Efficient Molecular Packing. arXiv.