十二、关系数据库
《数据邦新闻》是时下盛行的一份新闻类杂志,他们想把每期杂志的文章数目与销量关联起来,然后找出在每一期刊物上刊登文章的最优数量。他们希望每一期的杂志都能尽量经济有效,要是每期杂志刊登一百篇文章比刊登五十篇文章带来的销量并无提高,那他们就不刊登那么多;另一方面,要是刊登五十篇文章比刊登十篇文章能带来更大销量,那他们就会刊登五十篇文章。
通过销量表-->期刊表-->文章表,计算期刊的文章数目和销量
通过R绘制散点图:
dispatch<-read.csv("dispatch analysis.csv", header=TRUE)
plot(Sales~jitter(Article.count), data=dispatch)
jitter指令在数字中添加了一些噪音,使护具相互分割,以便易于在散点图上识别
下面是《数据邦新闻》的数据库架构,从其中找出网站点击率和网站评论最多的作者
使用R绘制散点图
library(lattice)
xyplot(webHits~commentCount | authorName, data=articleHitsComments)