- 博客(22)
- 收藏
- 关注
原创 pandas学习|第一部分:Pandas 简介:什么是 Pandas 及其重要性
Pandas 是一个基于 Python 的开源数据分析和操作库,构建在 NumPy 之上,提供了高效、灵活的数据结构和工具,广泛用于数据科学、机器学习和金融分析等领域。它以 DataFrame 和 Series 两个核心数据结构为中心,简化了数据的导入、清洗、转换和分析流程。Pandas 的设计目标是处理结构化数据(如表格或时间序列数据),使其成为 Python 数据分析生态系统的核心组件。
2025-06-01 22:44:23
236
原创 NAT类型
网络地址转换(Network Address Translation),也叫网络掩蔽或者IP掩蔽,是一种在IP数据包通过路由器或防火墙时重写来源IP地址或者目的IP地址的技术。
2025-05-25 23:28:40
278
原创 Dataworks使用PyODPS | MaxCompute | pyodps | odps
如果您需要使用上面列表中不存在的包,DataWorks节点提供了load_resource_package方法,支持从MaxCompute资源下载第三方包。使用pyodps-pack打包后,可以直接使用load_resource_package方法加载第三方包,之后就可以导入包中的内容。可以执行的SQL语句并非都可以通过入口对象的execute_sql()和run_sql()方法执行。在调用非DDL或非DML语句时,请使用其他方法。例如,调用GRANT或REVOKE语句时,请使用。
2025-05-22 09:49:37
654
原创 parquet | python操作parquet | python读取parquet文件 | python保存parquet文件
可能目前处理的数据还在excel、sas数据、csv等比较容易展示的数据存储,但随着大模型AI的发展,我们需要处理的数据量呈指数级增长。当涉及到项目中EDC数据的整合,使用传统关系型数据库也存在压力,因为我们主要关注数据的处理和整合,而没有太多的尽力花费时间在ETL的存储优化上,所以有一个高效的存储是很有必要的,Parquet 可以认为是当今存储数据的事实上的标准了。主要优势:1.数据压缩:通过应用各种编码和压缩算法,Parquet文件可减少内存、存储体积。
2025-05-20 21:55:03
437
原创 pandas核心内容 | pandas教程 | pandas常见问题 | pandas细节区分
选择多列,使用list存放列名,返回的仍然是一个DataFrame.一个pandas series没有列标签,Series有行标签。选择某一列的方式类似使用字典的某个key选择值。如果选择某一列,返回的结果是 Series.求某列最大值\最小值。
2025-05-20 21:51:22
943
原创 指令集架构 | 指令集 外部I/O寻址模式 异常处理
指令集是计算机处理器(CPU)能够理解和执行的机器语言指令的集合。它定义了处理器能够执行的基本操作,包括算术运算、逻辑运算、数据传输和控制流操作等。指令集架构(ISA)是处理器设计的一个关键部分,它决定了处理器如何与软件进行交互。ARM属于精简指令集(RISC) 1 -> 2 -> 3 -> 4 -> 5。x86 属于复杂指令集(CISC) 1 -> 5。
2025-05-11 10:44:37
188
原创 ubuntu | linux 安装 各版python (python3.10 为例)
Ubuntu|Linux系统安装Python各版本及其相关开发依赖项
2025-05-11 09:20:35
349
原创 python中各种配置文件的使用| .env .ini .json .yaml .toml .xml .py
这种方法本身就是用了python,所以可以实现复杂的逻辑。文件由多个节组成,每个节以方括号。开始,后面跟着键值对。文件作为配置文件,例如。在python中使用。在python中的使用。
2025-04-08 22:15:04
234
原创 xml结构 | xml解析 | 太美EDC下载xml| 临床试验数据传输ODM
XML(可扩展标记语言)是一种用于存储和传输数据的标记语言,它具有自我描述性且易于理解。通常记录有完整和详细的数据,但我们要能够使用,通常需要解析出我们需要的部分。能够更好的解析xml,首先对它的结构需要一定的了解才行。
2025-04-07 10:05:04
280
原创 python读取sas数据集 | 使用 pyreadstat 包读取sas数据集
pyreadstat 是一个 Python 库,用于读取和写入 SAS (包括 sas7bdat、sas7bcat、xport)、SPSS (sav、zsav、por) 和 Stata (dta) 数据文件。可以将数据写入 SPSS (.sav) 和 Stata (.dta) 格式保留原始文件的元数据,如变量标签、值标签、缺失值定义等。
2025-04-02 09:19:46
638
原创 Django入门 | Django快速上手
Django是一个用Python语言编写的高级Web框架,主要特点是“快速开发”和“开箱即用”。它特别适合快速搭建Web应用或API服务,尤其在需要处理数据库和后端逻辑时非常强大。需要三个表:业务字段、标准字段和映射关系在中定义编辑# 业务项目字段name = models.CharField(max_length=100, unique=True) # 字段名description = models.TextField(blank=True) # 描述,可为空# 标准表字段# 映射关系。
2025-04-01 01:49:36
933
原创 关于MacOS软件已损坏,无法打开的解决方案
当你第一次打开这些文件或应用程序时,系统会弹出警告,提示用户确认是否要打开。前往 “系统设置” -> “隐私与安全性”,在“安全性”选项下会出现一个提示,点击“仍要打开”即可。请注意,此操作仅需进行一次,之后您便可正常打开应用。macOS Ventura 在安全性方面有提升,执行完上述两个步骤后,需要在“系统设置”中手动打开应用。到 系统偏好设置 -> 安全性与隐私, 在"通用"标签页中勾选相应的选项。macos安装下载的软件,提示"应用程序已损坏,无法启动"
2025-03-30 10:41:05
881
原创 win安装 .NET Framework 3.5 | win离线安装 .NET Framework 3.5 | SAS安装报错 .NET Framework 3.5 安装失败
windows安装 .NET Framework 3.5 通过在线和离线两种方式。
2025-03-29 23:58:25
1451
原创 R 语言中函数名冲突的处理:使用双冒号操作符
在 R 语言中,当多个包包含同名函数时,会发生函数名冲突。例如,stats 包和 dplyr 包都有 filter 函数,但用途不同:stats 的 filter 用于时间序列过滤,dplyr 的 filter 用于数据框行选择。如果同时加载这两个包,调用 filter 时,R 会根据搜索路径选择一个函数,这可能导致意外结果。
2025-03-29 20:08:31
340
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人