《深入浅出数据分析》-12.关系数据库

十二、关系数据库

《数据邦新闻》是时下盛行的一份新闻类杂志,他们想把每期杂志的文章数目与销量关联起来,然后找出在每一期刊物上刊登文章的最优数量。他们希望每一期的杂志都能尽量经济有效,要是每期杂志刊登一百篇文章比刊登五十篇文章带来的销量并无提高,那他们就不刊登那么多;另一方面,要是刊登五十篇文章比刊登十篇文章能带来更大销量,那他们就会刊登五十篇文章。

通过销量表-->期刊表-->文章表,计算期刊的文章数目和销量

通过R绘制散点图:

dispatch<-read.csv("dispatch analysis.csv", header=TRUE)

plot(Sales~jitter(Article.count), data=dispatch)

jitter指令在数字中添加了一些噪音,使护具相互分割,以便易于在散点图上识别

下面是《数据邦新闻》的数据库架构,从其中找出网站点击率和网站评论最多的作者

使用R绘制散点图

library(lattice)

xyplot(webHits~commentCount | authorName, data=articleHitsComments)

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值