数据分享|函数型数据分析部分省市新冠疫情数据

本文通过函数型数据分析部分省市新冠疫情数据,采用B样条基拟合数据并进行主成分分析,揭示疫情发展趋势。数据显示,北京、重庆、江西等省市在疫情高峰期间感染比例较大,而河南、广东、湖南、上海等地控制效果较好。前两个主成分包含了超过92%的数据信息。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

全文链接:http://tecdat.cn/?p=28716

作者:Mingji Tang

统计学中传统的数据类型有截面数据和时间序列数据。这两者都只能在某一纵向或横向上探究数据,且部分前提条件又很难满足。而函数型数据连续型函数与离散型函数长期以来的分离状态,实现了离散和连续的过度。它很少依赖于模型构建及假设条件。通过使用函数型数据,我们可以发掘新冠疫情数据中更多的信息。

相关视频

一、数据的收集与整理

选择人口流动较大的北京、上海、广东,以及与武汉相邻的重庆、湖南、江西、安徽、河南,一共八个省级行政区的确诊人数变化数据查看文末了解数据免费获取方式作为样本。

f4bf78aa8281d5791f63d45c542c66c8.png

考虑到各省市人口数量差异较大,使用确诊人数和总人数的比例作为数据研究对象更加合理。

fc80cbffb683fb443c111c58c38d521d.png

二、  建立函数型数据对象

采用B样条基线性函数拟合离散的数据。使用最小二乘法得到系数。

929c873dbd3c2c13d7db8d45f0fb1695.png

然后通过粗糙惩罚来提高函数的光滑性。设置惩罚项为53f75c95bb918b284716b4c5a739af27.png

则新的需要最小化的式子为:

a7eb817c7e070440631df6f7dc916134.png

可以得到光滑化之后的函数型数据。

b2b1738c94ae2626a790dbfeb2d72ef6.png


点击标题查阅往期内容

3e5669f58ca5d09de34cb40f7c71e726.png

Python用RNN神经网络:LSTM、GRU、回归和ARIMA对COVID19新冠疫情人数时间序列预测

outside_default.png

左右滑动查看更多

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值