皆さん、こんにちは!
今日は、今話題のオープンソース逆合成解析ソフトウェア
LillyMol
をDockerを使って手軽に動かしてみましょう!
LillyMol?は、Eli Lilly and Companyが開発した強力なツールで、複雑な化学構造を入力するだけで、合成可能な経路を提案してくれます。今回は、Dockerを利用することで環境構築の手間を省き、誰でも簡単にLillyMol?の世界を体験できる方法を紹介します。
まずは、LillyMol?を使うための環境をDockerで構築します。
1. **Dockerのインストール:** まだDockerをインストールしていない方は、[https://docs.docker.com/get-docker/](https://docs.docker.com/get-docker/) を参考にインストールを済ませてください。
2. **LillyMol?イメージの取得:** ターミナルを開き、以下のコマンドを実行してLillyMol?のDockerイメージを取得します。
docker pull lillymol/lillymol
3. **LillyMol?コンテナの起動:** イメージの取得が完了したら、以下のコマンドでコンテナを起動します。
docker run -p 8080:8080 lillymol/lillymol
このコマンドは、LillyMol?をポート8080で起動することを意味します。
4. **ブラウザでアクセス:** Webブラウザ
ブラウザでアクセス: Webブラウザを開き、`http://localhost:8080` にアクセスします。LillyMol?のウェブインターフェースが表示されるはずです。
これで、LillyMol?の環境構築は完了です!簡単でしたね。
では、実際にLillyMol?を使って逆合成解析を行ってみましょう。例として、アスピリン(アセチルサリチル酸)の合成経路を探ってみます。
1. LillyMol?のウェブインターフェースで、「Retrosynthesis」タブを選択します。
2. 「Enter SMILES or draw structure」欄に、アスピリンのSMILES表記を入力します:
CC(=O)OC1=CC=CC=C1C(=O)O
3. 「Run Retrosynthesis」ボタンをクリックします。
4. LillyMol?が計算を行い、可能な逆合成経路を提案してくれます。
結果の解釈:
アスピリンの例を参考に、自分が興味を持っている化合物のSMILES表記を入力して、逆合成解析を行ってみましょう。例えば:
注意点:
LillyMol?には他にも多くの機能があります。例えば:
1. 構造検索: 類似の化合物を探すことができます。
2. 物性予測: LogP、溶解度、pKaなどの物性を予測できます。
3. 反応予測: 特定の反応条件下での生成物を予測できます。
これらの機能を使いこなすことで、化学研究の幅が大きく広がるでしょう。
DockerとLillyMol?を組み合わせることで、手軽に強力な逆合成解析ツールを使うことができました。この環境を活用して、新しい化合物の合成経路を探索したり、既知の合成経路を最適化したりする可能性は無限大です。
化学の世界は奥深く、まだまだ発見の余地がたくさんあります。LillyMol?を使って、あなただけの化学の冒険に出かけてみてはいかがでしょうか?
次回は、LillyMol?の高度な使い方や、他の化学情報学ツールとの連携について紹介する予定です。お楽しみに!
https://github.com/EliLillyCo/LillyMol
サンプルとして使ったSMILES化学式
CN1C2=C(C=C(C=C2)C3=CN=CS3)C(=CC1=O)NC4CCC(CC4)OCCOC
結果を評価するためにつかったwiki
https://en.wikipedia.org/wiki/CD38-IN-78c
https://pubchem.ncbi.nlm.nih.gov/
SMILESだけでなく、 IUPAC名、分子式など、様々な入力形式に対応しています。 NCBIの巨大なデータベースで検索でき、 化合物情報、生物活性、文献情報などを取得できます。
こちらも複数の入力形式に対応し、膨大なデータベースを誇ります。 スペクトルデータ、物性情報、関連化合物など、豊富な情報を提供しています。
近い分子式や、近い骨格の分子をリストアップしてくれます。
AIが、この分子の特徴を推定してくれます。何度で燃えるとか。そういうやつです。
取り扱い企業をリストアップしてくれます。
https://webbook.nist.gov/chemistry/
将来的に課金するかもと書いてあったので、シークレットモードで検索したほうが無難?
アメリカ国立標準技術研究所 (NIST) が提供するデータベースです。
スペクトルデータ、熱力学データ、反応データなど、信頼性の高い情報を検索できます。
https://cactus.nci.nih.gov/chemical/structure
SMILESを他の形式 (IUPAC名、MOLファイルなど) に変換できます。
バッチ処理にも対応しており、大量のSMILESを一度に変換できます。
SMILESを入力すると、3D分子モデルを表示できます。
分子の回転、拡大縮小、原子情報の表示などが可能です。
日本語の紹介記事がありました。
https://tky-pychemweb.hatenablog.com/entry/2022/09/19/161606