自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(92)
  • 收藏
  • 关注

原创 Essential Cell Biology--Fifth Edition--Chapter one (8)

运动蛋白[Motor proteins]利用储存在ATP分子中的能量,沿着这些轨道和电缆[cables]移动[trundle along],携带细胞器和蛋白质穿过细胞质,并在几秒钟内快速穿过[racing across]细胞的宽度。此外,填充细胞中每个自由空间的大分子和小分子被随机的热运动来回撞击[knocked to and fro],不断地相互碰撞[colliding with one another],并与细胞中拥挤的细胞质中的其他结构碰撞。予细胞机械强度,控制细胞的形状,并驱动和引导细胞的运动。

2024-11-17 22:11:43 949

原创 Essential Cell Biology--Fifth Edition--Chapter one (7)

在内质网、高尔基体、溶酶体、质膜和细胞外部之间进行着持续的物质交换。这种交换是由运输囊泡[transport vesicles]介导[is mediated by]的,这些囊泡从一个细胞器的膜上夹下来[pinch off],并与另一个细胞器融合,就像微小的肥皂泡从其他气泡中发芽[bud]并结合。例如,在细胞表面,细胞质膜的一部分向内收缩[tuck inward],形成囊泡,将从外部介质捕获的物质带入细胞,这一过程称为胞吞作用[endocytosis](图1-25)。

2024-11-16 22:20:15 413

原创 Essential Cell Biology--Fifth Edition--Chapter one (6)

它是大多数细胞膜成分,以及从细胞输出的材料的制造场所。溶酶体[Lysosomes]是一种形状不规则的小细胞器,细胞内发生消化[digestion],将摄入的食物颗粒中的营养物质释放到细胞质中,并分解不需要的分子,以便在细胞内循环或从细胞中排泄。过氧化物酶体[Peroxisomes]是一种小的、膜封闭的囊泡[vesicles],它为过氧化氢用于灭活有毒分子[inactivate toxic molecules]的各种反应提供了一个隔绝的环境[sequestered environment]。

2024-11-15 22:18:20 563

原创 Essential Cell Biology--Fifth Edition--Chapter one (5)

当用电子显微镜观察时,可以发现单个的线粒体被包裹在两个独立的膜中,内膜形成褶皱,投射到细胞器的内部(图1-18 (A)线粒体横切面的电子显微镜照片显示了线粒体内膜的广泛内折叠。叶绿体进行光合作用[carry out photosynthesis]——在它们的叶绿素分子中捕获[trap]阳光的能量,并利用这些能量来驱动富含能量的糖分子的制造。它们利用[harness]食物分子(如糖)氧化[oxidation产生的能量来产生三磷酸腺苷(atp),这是一种基本的化学燃料,为细胞的大部分活动提供动力。

2024-11-14 20:05:45 606

原创 Essential Cell Biology--Fifth Edition--Chapter one (4)

古生菌不仅存在于这些栖息地中,也存在于对大多数其他细胞来说过于恶劣的[hostile]环境中:浓盐水[concentrated brine]、火山泉水的热酸、无空气的海洋沉积物[marine sediments]深处、污水处理厂的污泥[sludge of sewage]、南极洲冰冻表面下[beneath]的水池,以及牛胃的酸性无氧环境中,它们在那里分解[break down]摄取的纤维素[ingested cellulose]并产生甲烷气体。植物也可以从阳光中获取能量,从大气中的二氧化碳中获取碳。

2024-11-12 14:36:53 784

原创 Essential Cell Biology--Fifth Edition--Chapter one (3)

然而,近年来,被称为荧光显微镜[fluorescence microscopes]的新型光学显微镜已经被开发出来,它使用复杂的照明和电子图像处理方法来观察荧光标记的细胞成分的更详细的细节(图1-7B)。(图1-6中的组织就是这样制备的。有生命的有机体不是自发产生[arise spontaneously]的,而是只能从现存的有机体中产生的,这一观点曾引起激烈的争论[hotly contested],但在19世纪60年代,路易斯·巴斯德(Louis Pasteur)完成的一组优雅的实验最终证实了这一点。

2024-11-11 20:15:17 841

原创 Essential Cell Biology--Fifth Edition--Chapter one(2)

然而,所有这些分化的细胞类型都是在胚胎发育过程中由单个受精卵细胞产生的,它们含有相同的物种DNA副本。不同的细胞表达不同的基因:也就是说,它们利用自己的基因产生某些RNA和蛋白质,而不是其他的,这取决于它们的内部状态,以及它们和它们的祖先细胞从周围环境中接收到的线索(主要是来自生物体中其他细胞的信号)。突变可以产生的后代有向坏的方向改变(因为[in that]他们更不能够生存和繁殖),有向好的方向改变(因为他们更能够生存和繁殖),或者以中性[neutral]的方式改变(因为他们的基因不同,但同样可行)。

2024-11-10 20:58:35 967

原创 Essential Cell Biology -- Fifth Edition

今天开始看一本书,单纯想学生物和英语。如果有错误烦请大家指出。是总结,

2024-11-09 16:38:46 885

原创 蛋白质致病突变的计算方法(八)

阿尔茨海默病(Alzheimer’s disease, AD)是各种神经系统疾病的主要标志(hallmark)疾病之一。已知在疾病样本中存在大量的蛋白质编码错义突变,主要靶点是presenilin 1 (PSEN1)、presenilin 2 (PSEN2)和淀粉样前体蛋白(APP)。致病突变信息在阿尔茨海默病测序项目(ADSP)数据库、阿尔茨海默病遗传学联盟(ADGC)和欧洲阿尔茨海默病联盟(EADC)等数据库中进行了注释。

2024-04-29 13:15:10 305

原创 蛋白质致病突变的计算方法(七)

这些模型使用蛋白质序列特征的不同组合,如PSSM谱、守恒分数、理化性质、邻近残基信息和膜蛋白的属性,如不同拓扑区域残基的比例、跨膜段的数量和prtn的替代矩阵。许多功能重要的突变已在IDH1 (R132H/G/L/S)、IDH2 (R140Q)、EGFR和BRAF中被确定,它们是癌症中众所周知的表观遗传修饰因子。因此,SIFT 、PolyPhen 、MutationTaster 和Cscape等计算方法使用基于结构、序列和网络的特征来预测蛋白质编码的单核苷酸变体对蛋白质结构表型的影响。

2024-04-26 16:11:49 469

原创 蛋白质致病突变的计算方法(六)

致病热点残基是蛋白质中特定的氨基酸位置,在突变时可导致疾病的发生。识别这些热点残基是了解疾病进展机制和开发潜在治疗策略的重要一步。Takeuchi 等人在BRCA1和BRCA2基因中发现了热点残基,它们与乳腺癌风险增加有关。Chang等人在41种癌症类型中确定了470个体细胞突变热点,这些突变热点似乎会影响各自蛋白质的分子功能。其他用于热点残基的重要数据库和服务器包括HotMAPS、HotSpoAnnotations 、HotSpot3D 、Mutation3D ,它们用于识别癌症中的突变簇。

2024-04-25 11:28:51 852

原创 蛋白质致病突变的计算方法(五)

Wu et al.系统地分析了20种不同遗传疾病的突变,并报道了每种可能突变的频率。从图4的数据可以看出,从发病情况来看,E→K、G→R、R→C、R→H、R→Q、R→W等特异性突变在疾病中较为普遍。图 4与遗传疾病相关的一组蛋白质的突变偏好。矩阵的每个元素表示氨基酸突变的数量(从列到行)。最高频率的2.5%用红色表示,2.5-12.5%用橙色表示,剩余的非零单元格用黄色表示。

2024-04-24 11:41:31 689

原创 已知uniport ID 下载 seq

task如题,可以改成批处理的代码哦。

2024-04-23 14:54:12 680

原创 蛋白质致病突变的计算方法(四)

此外,已经报道了针对特定基因组或蛋白质家族的特殊基质,以及恶性疟原虫和约利疟原虫的富集基因组,整合膜蛋白, β-桶跨膜蛋白,G蛋白偶联受体的视紫红质家族,蛋白质-蛋白质相互作用网络的枢纽蛋白和本质紊乱蛋白。度中心性衡量的是网络中一个蛋白质(或氨基酸)与其他蛋白质(或氨基酸)相互作用的次数,而介数中心性衡量的是一个蛋白质在网络中充当其他蛋白质(或氨基酸)之间桥梁的次数。(举这些例子的目的是通过具体的案例来说明在不同蛋白质中突变的位置和性质可能导致的不同影响,以及这些影响可能如何与癌症的发生和发展相关联)

2024-04-23 14:47:26 1320 1

原创 蛋白质治病突变的计算方法(三)

文献中使用了几种特征来识别蛋白质中的致病突变。它们大致分为三类:(1)序列,(2)结构和(3)网络,以及它们的组合。图1说明了这三组中的一些重要属性。图1 用于识别致病突变和热点的重要特征。基于氨基酸序列的特性包括理化特性、二级结构、位置特异性得分矩阵(PSSM)、特异性基序(motifs)和保守性得分。基于结构的性质包括界面分布(interface profiles)、残基的位置在核心和表面、相对溶剂可及面积(RSA)、体积、氢键供体和受体以及统计势能(statistical potentials)

2024-04-22 12:57:11 1165

原创 蛋白质致病突变的计算方法(二)

(继续上一篇)

2024-04-19 13:53:39 1100 1

原创 蛋白质致病突变的计算方法(一)

目前,文献中可用的突变数据已被整理(curate)并存储在几个数据库中,这些数据已被有效地用于开发利用蛋白质的序列和结构属性识别有害(deleterious)突变(drivers)的计算方法。在本章中,我们将描述特定数据库的内容,这些数据库包含致病和中性(neutral)突变的信息(information on),然后(followed by)是基于序列和结构的属性。列出了重要的基于序列和结构的属性,这些属性在文献和计算工具中广泛用于识别癌症热点残基,以及区分蛋白质中的致病突变和中性突变。

2024-04-18 11:36:49 586

原创 已知genebank号 批处理获取gene ID和序列信息

处理一个公开数据集,发现多个genebank号对应1个gene ID,所以写了个脚本在NCBI接口批处理了一下。同时为了避免被封,添加了sleep,不知道是否好用,结过是几万的数据依然很流畅~~

2024-04-10 12:38:45 757

原创 VSCode SSH 连接 Could not establish connection to “XXX“: spawn UNKNOWN.

进入 ssh 插件的设置(可以通过在插件上选择设置按钮,也可以 ctrl + shift + p 再输入 ssh,选择 settings),在里面找到 Remote.ssh:Path 选项。默认本地路径: C:\Windows\System32\OpenSSH。拉取vscode终端:快捷键 ctrl+`(数字1旁边那个)2.1 找到本地SSH 位置。2.2 找到要修改的位置。

2024-04-04 10:45:06 1184

原创 variant calling--SComatic

方法来自论文:De novo detection of somatic mutations in high-throughput single-cell profiling data sets。找到需要的染色体的fa.gz文件,右击-->复制链接地址-->linux端。将以上代码段写在.sh脚本中,执行 ./ **.sh 运行即可。我的任务是在几个scRNA数据中找到在突变基因不同细胞中特异性的表达。2. 解压染色体文件,并得到染色体的.fai文件。声明:我要处理的是hg38的染色体。

2024-03-26 10:41:10 458

原创 Pymol 常用指令:mutation in Pymol

Pick-#73 Glu, Color->yellow, 可以看到黄色是点突变以后Trp, 红色是原来的Glu. 点击Apply保存就只剩下黄色的Trp了。点show->stick;最近想尝试突变是否会改变蛋白质结构,想起来之前安装的Pymol有蛋白质可视化功能,所以小小记录一下。可以看到,做完点突变后,周围残基并没有发生构象上的变化,意味着pymol不会自动做能量最小化处理。3. 点Wizard->Mutagenesis->protein;OK,介绍 1b27蛋白质第73个残基由E变成W的过程。

2024-03-18 11:18:37 1567 1

原创 服务器权限:Error: EACCES: permission denied, open‘/Cardiac/uniquC.csv

我想在服务器上传一个文件uniquC.csv,但是服务器说我没有权限。1. 查看目前是否存在对文件夹的权限。这也意味着root也没有赋予写的权限。然后输入root密码。4. 查看当前的权限。

2024-02-26 15:16:40 589

原创 google cloud storage批量文件下载

注意:3中复制的语言需要修改:1)去掉开始位置的 \ 2)删除” 前后的空格 3) 最简单的方法去chatgpt粘贴一下,他会给你正确的格式(已经崩溃,自己改了好多次没改对……),所以最后的样子应该是。我是先cd进了目标文件夹,所以保存的local路径是 .。1.首先创建项目,或者用之前的项目都可以。2.然后选中要下载的文件,点击下载。4.修改指令,并使用项目名称。

2024-01-16 12:37:15 1674 3

原创 google cloud storage: Bucket is a requester pays bucket but no user project provided

啊啊,一整天熬到2点就干了个这,这收钱的界面做的太隐蔽了,根本找不到,花钱都花不出去……关于Enformer脚本的解析和数据等问题也可以问,可以考虑写个专辑了。bash脚本如果有需要可以在评论区提问。

2024-01-11 10:36:45 618 2

原创 pymol--常用指令

3.还发现Pymol>后的框可以通过上↑下↓箭头会到前后指令,这与Linux是一样的。新年快乐~~~ 1.1号写了点 但是太少了没发。1. 显示蛋白质序列,点击右下角的S就可以。2. 隐藏其中一条蛋白质序列。

2024-01-09 16:28:42 1431

原创 pymol--常用指令

1)Pymol> load name.pdb, name # 载入pdb文件,并命名,我还没试过Pymol> fetch proteinID # 直接就加载了 我用的这个右边选框,有A S H L C指令。

2023-12-28 10:34:43 2029

原创 Pymol入门---安装Windows 多版本下载

Pymol需要文件,最好去下载清华提供的镜像,网速会很快由于我在本地有3.9的python,所以我先查了适配哪个Anaconda,然后选择在清华镜像源下载Anaconda3-2022.10的版本。下载后进行安装。

2023-12-28 10:21:34 2635

原创 在公共服务器/集群上 安装Linux pycharm 并在窗口调出pycharm界面

1.enter the web:https://www.jetbrains.com/pycharm/download/?section=linux#section=linux2.upload software (yourself folder)3.cd software4.find the Compressed package: .tar.gz5.Decompress:tar zxf pycharm-professional-2023.2.3.tar.gz6.cd pycharm-2023.2.3/bin/

2023-10-30 10:43:54 1072

原创 如何根据蛋白质序列找到蛋白质ID

4. 筛选,左边有物种,0.98为score,取score最小的,原理不知。7. 验证结果:判断序列与找到的蛋白质ID序列是否一致。5. 可下载相关文件。

2023-08-20 20:26:46 4575

原创 RuntimeError: CUDA error: no kernel image is available for execution on the device

RuntimeError: CUDA error: no kernel image is available for execution on the deviceOSError: /home/aita/anaconda3/envs/FusionDTA/lib/python3.7/site-packages/nvidia/cublas/lib/libcublas.so.11: symbol cublasLtHSHMatmulAlgoInit version libcublasLt.so.11 not de

2023-04-06 20:11:09 1153

原创 已知下载链接,使用python下载数据

平常数据一般下到本地然后上传到服务器,但是内存告急,想起来之前用命令行下载数据,写了2行代码搞定。

2023-03-22 11:43:57 445

原创 python pd.DataFram series转ndarry,然后转为(X,1)格式

在调试代码时报错:python key of type tuple not found and not a MultiIndex

2023-03-20 09:17:36 1107

原创 tensor与numpy、array的转换,针对RuntimeError: Can‘t call numpy() on Variable that requires grad问题

tensor与numpy、array的转换,针对RuntimeError: Can‘t call numpy() on Variable that requires grad问题

2023-03-08 09:09:10 459

原创 记录 No module named ‘Bio‘

安装或调用python3,biopython。python2 里面用的module是。python3 里用的module是。

2023-02-24 21:47:32 4556 1

原创 ERROR: Could not install packages due to an OSError: [Errno 2] 没有那个文件或目录

ERROR: Could not install packages due to an OSError: [Errno 2] 没有那个文件或目录: '../lib/python3.7/site-packages/numpy-1.21.6.dist-info/METADATA'找到目录也就是:/lib/python3.7/site-packages/numpy-1.21.6.dist-info,然后创建一个文件METADTATA。

2023-02-24 21:43:06 1650

原创 Python + Uniprot获取蛋白质的功能向量

官网http://geneontology.org/docs/download-ontology/http://purl.obolibrary.org/obo/go.obo,右键点击该链接。我随机选中HSPA8基因的4个,然后 Download得到一个压缩包。3.对得到的压缩包进行数据处理,生成蛋白质数据的dataframe。1. 需要一个.obo文件,为了获得现在所有蛋白质的功能GO。选择’链接另存为’,即可下载最新版的go.obo文件。4. 处理得到最新的GO字典,并生成功能标签。

2023-01-17 15:04:12 705

原创 Linux导出环境包 .yaml permission deined

存在的目的是提供当前代码运行所需要的环境或者依赖信息,即这些东西的安装是当前代码运行的前提条件。这些信息相当于是开发者给使用者提供的用于恢复自己开发时的环境的信息。首先,我使用 ls -l,查看了anaconda的权限,发现权限正常,root,用户和其他都有读、写、可执行的权限。1. LInux导出环境包一般有2种:requirement.txt;然后,我发现当前路径不在代码目录下,换到代码目录下可以成功转出。4. 审稿意见涉及导出环境.yml,但是我一直permission deined。

2023-01-14 22:11:58 645

原创 HDIContact: a novel predictor of residue–residue contacts on hetero-dimer interfaces via sequential

HDIContact: a novel predictor of residue–residue contacts on hetero-dimer interfaces via sequential information and transfer learning strategy文章梳理

2022-08-31 11:07:00 3420 3

原创 python 获取某个字符指定字符的前面、后面和中间的字符

获取某个字符指定字符的前面或后面的所有字符内容

2022-08-18 15:59:03 11211 1

原创 python 读取.csv文件,跳过第一行的表头:drop

读取.csv文件,跳过第一行的表头:drop

2022-08-10 17:38:14 4860

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除