Drug Repurposing Knowledge Graph (DRKG) 使用教程

Drug Repurposing Knowledge Graph (DRKG) 使用教程

DRKG A knowledge graph and a set of tools for drug repurposing DRKG 项目地址: https://gitcode.com/gh_mirrors/dr/DRKG

1. 项目介绍

Drug Repurposing Knowledge Graph (DRKG) 是一个综合性的生物知识图谱,它关联了基因、化合物、疾病、生物过程、副作用和症状等信息。DRKG 汇集了来自六个现有数据库(包括 DrugBank、Hetionet、GNBR、String、IntAct 和 DGIdb)的数据,以及与 Covid19 相关的最新文献资料。它包含了 97,238 个实体和 5,874,261 个三元组,涵盖了 107 种关系类型,展现了不同实体类型之间的相互作用。

2. 项目快速启动

要快速启动 DRKG,首先需要下载知识图谱数据。可以使用以下命令下载:

wget https://dgl-data.s3-us-west-2.amazonaws.com/dataset/DRKG/drkg.tar.gz

下载后,解压文件:

tar -xvzf drkg.tar.gz

解压后将得到以下文件:

  • drkg.tsv:包含原始 DRKG 数据的三元组文件。
  • entity2src.tsv:实体到原始数据源的映射文件。
  • relation_glossary.tsv:关系术语表文件。
  • embed:预训练知识图谱嵌入和分子嵌入的文件夹。

要加载预训练的实体嵌入和关系嵌入,可以使用以下 Python 代码:

import numpy as np

entity_emb = np.load('./embed/DRKG_TransE_l2_entity.npy')
rel_emb = np.load('./embed/DRKG_TransE_l2_relation.npy')

3. 应用案例和最佳实践

以下是使用 DRKG 的一些应用案例和最佳实践:

  • 数据探索:使用 DRKG 的统计数据和关系类型来探索不同实体之间的关联。
  • 知识图谱嵌入:使用预训练的嵌入来执行实体和关系的相似性搜索。
  • 图神经网络分析:利用 DGL 框架对 DRKG 进行图神经网络分析,以识别潜在的药物再利用机会。

4. 典型生态项目

  • DGL-LifeSci:用于生物科学领域图神经网络研究的框架,可以与 DRKG 配合使用。
  • 知识图谱嵌入工具:如 TransE、TransH 等,用于训练实体和关系嵌入。
  • 机器学习框架:如 TensorFlow、PyTorch,可以用于进一步开发和训练基于 DRKG 的模型。

以上就是关于 Drug Repurposing Knowledge Graph (DRKG) 的使用教程。通过这些步骤,您可以开始探索和利用这个强大的生物知识图谱资源。

DRKG A knowledge graph and a set of tools for drug repurposing DRKG 项目地址: https://gitcode.com/gh_mirrors/dr/DRKG

### DeepPurpose 使用教程 #### 激活 Python 虚拟环境 为了确保开发环境中所需的依赖项得到管理,建议激活专门为此项目设置的 Conda 环境。这可以通过命令 `conda activate DeepPurpose` 来完成[^2]。 #### 访问启动文件 DeepPurpose 的主要交互方式是通过一系列位于 `DEMO/` 目录下的 Jupyter Notebook 文件实现的。这些笔记本文档不仅作为入门指南,还展示了不同应用场景的具体操作方法: - **分子生成**: 通过打开 `Demo_BindingDB_Molecular_Generation.ipynb` 可学习到如何应用该库来进行新化学实体的设计与预测。 - **回归分析**: 对于那些想要探索定量构效关系研究的人来说,《Demo_BindingDB_Regression.ipynb》是一个很好的起点,这里解释了怎样执行基于结构活性的数据建模任务。 - **药物重定位**: 若要理解现有药品可能的新治疗用途,则应查看《Demo_Repurposing.ipynb》,此文档指导用户进行跨适应症潜力评估的工作流程[^3]。 #### 功能概述 DeepPurpose 将其核心能力分解成六个易于遵循的操作步骤,使得即使是初学者也能迅速上手: 1. 数据获取:支持从本地导入自定义数据集或是直接访问内置的标准测试集合; 2. 编码设定:允许指定用于表示小分子及大分子序列特征的方法; 3. 预处理:提供灵活的数据分割选项来准备训练样本; 4. 参数调整:帮助构建适合特定问题类型的机器学习架构,并能自动化寻找最佳配置; 5. 模型实例化:既可以从头开始建立新的预测工具,也能够恢复之前保存的状态继续工作; 6. 学习过程控制:最终一步涉及到了实际的学习循环,在这一阶段会不断优化权重直至达到满意的性能水平[^4]。 ```python from deepchem.feat import MolGraphConvFeaturizer featurizer = MolGraphConvFeaturizer() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

明树来

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值