如何快速上手ProteinMPNN5分钟完成你的第一个蛋白质设计任务【免费下载链接】ProteinMPNN项目地址: https://ai.gitcode.com/AI4Science/ProteinMPNNProteinMPNN是一款强大的蛋白质序列设计工具基于深度学习技术能够帮助科研人员快速生成符合特定结构要求的蛋白质序列。本文将带你快速掌握ProteinMPNN的使用方法在5分钟内完成你的第一个蛋白质设计任务。一、准备工作环境搭建1.1 克隆项目仓库首先你需要克隆ProteinMPNN项目仓库到本地git clone https://gitcode.com/AI4Science/ProteinMPNN cd ProteinMPNN1.2 安装依赖ProteinMPNN需要Python 3.0及以上版本以及PyTorch、Numpy等依赖库。你可以使用conda或pip进行安装# 使用conda安装 conda install pytorch torchvision torchaudio cudatoolkit11.3 -c pytorch # 或使用pip安装 pip install torch2.6.0二、快速上手运行你的第一个示例2.1 了解示例脚本ProteinMPNN提供了多个示例脚本位于examples/目录下。其中submit_example_1.sh是一个简单的单体蛋白质设计示例。2.2 运行示例脚本执行以下命令运行示例脚本cd examples bash submit_example_1.sh2.3 示例脚本解析让我们简单了解一下submit_example_1.sh的工作流程设置输入输出路径folder_with_pdbs../inputs/PDB_monomers/pdbs/ output_dir../outputs/example_1_outputs输入PDB文件位于inputs/PDB_monomers/pdbs/目录输出结果将保存在outputs/example_1_outputs/目录。解析PDB文件python ../helper_scripts/parse_multiple_chains.py --input_path$folder_with_pdbs --output_path$path_for_parsed_chains使用helper_scripts/parse_multiple_chains.py脚本解析PDB文件生成JSONL格式的输入文件。运行ProteinMPNNpython ../protein_mpnn_run.py \ --jsonl_path $path_for_parsed_chains \ --out_folder $output_dir \ --num_seq_per_target 2 \ --sampling_temp 0.1 \ --seed 37 \ --batch_size 1调用protein_mpnn_run.py主程序生成2条蛋白质序列采样温度为0.1。三、查看结果运行完成后你可以在outputs/example_1_outputs/seqs/目录下找到生成的蛋白质序列文件如5L33.fa和6MRR.fa。这些文件包含了设计好的蛋白质序列你可以用它们进行后续的实验或分析。四、进阶使用4.1 尝试其他示例ProteinMPNN还提供了多个其他示例如submit_example_2.sh蛋白质复合物设计示例submit_example_3.sh基于PSSM的设计示例submit_example_4.sh固定部分残基的设计示例你可以通过运行这些示例来了解ProteinMPNN的更多功能。4.2 使用Colab Notebook如果你没有本地环境也可以使用Colab Notebook快速体验ProteinMPNN。项目提供了colab_notebooks/quickdemo.ipynb等Notebook文件方便你在浏览器中运行蛋白质设计任务。五、总结通过本文的介绍你已经了解了ProteinMPNN的基本使用方法并成功运行了第一个蛋白质设计示例。ProteinMPNN作为一款强大的蛋白质序列设计工具能够帮助你快速生成符合特定结构要求的蛋白质序列加速你的科研工作。如果你想深入了解ProteinMPNN的更多功能和参数可以参考项目的官方文档和源代码。祝你在蛋白质设计的道路上取得更多成果 【免费下载链接】ProteinMPNN项目地址: https://ai.gitcode.com/AI4Science/ProteinMPNN创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考