ggplot2学习笔记(1):文艺作图系统

star2017 1年前 ⋅ 11294 阅读

最近发现了一个文艺作图系统:ggplot2
是统计软件R下面的一个包,作者Hadley Wickham现在在Rice University当Assistant Professor

R本来的作图系统已经很强大了,但是我看到ggplot2的输出结果真的是惊为天人啊,而且它的图层概念也非常赞。可以说R的graphics包是普通作图,ggplot2是文艺作图,而SAS之类的就是二逼作图了(这里断没有鄙视SAS的意思)。

安装完R以后,用install.packages(‘ggplot2’)安装ggplot2包即可使用

测试数据集是ggplot2中的data(mpg),这是一个包括234个样本的不同品牌的汽车耗油量与性能等变量的数据集,具体可以用?mpg查看

(1)散点图

p210735331-1
散点图:qplot(displ, hwy, data=mpg)

## displ= engine displacement, hwy=highway miles per gallon
qplot(displ, hwy, data=mpg)

(2)用colour, size, shape区分不同的属性变量

p210735331-2
用颜色区分的散点图

# 按颜色分类,变量为离散变量
qplot(displ, hwy, colour = class, data = mpg)

# 当颜色分类变量为连续变量时
qplot(displ, hwy, colour = cty , data = mpg)

# 调整size和shape(不支持连续变量)
qplot(displ, hwy, size = class, data = mpg)
qplot(displ, hwy, shape = class, data = mpg)

p210735331-3
用颜色与尺寸进行区分的散点图

#size按属性变量class区分,colour按属性变量trans区分
qplot(displ, hwy, size = class, colour = trans, data = mpg)

(3)用facet_grid()和facet_wrap() 进行按属性变量划分的多个散点图的同时绘制

p210735331-4
按两个类别进行分类的散点图

# 加号表示增加图层
# facet_grid(): 2-dimension grid, rows ~ cols,
qplot(displ, hwy, data = mpg) +
facet_grid(. ~ cyl)

qplot(displ, hwy, data = mpg) +
facet_grid(drv ~ .)

qplot(displ, hwy, data = mpg) +
facet_grid(drv ~ cyl)

p210735331-5
按一个类别进行分类的散点图

# facet_wrap(): 1-dimension grid
qplot(displ, hwy, data = mpg) +
facet_wrap(~ class)

(4) reorder()在图形上自动实现按某些变量的排序

p210735331-6
按某些指标自动排序的散点图

#reorder(class,hwy),自动调整属性变量class的排序,使得类别的hwy从小到大
qplot(reorder(class, hwy), hwy, data = mpg)

p210735331-7
按色彩分类与箱线图,加入随机扰动(为了防止出现多个点在一点覆盖的现象)

# geom = c(“jitter”, “boxplot”), jitter增加随机扰动(显示重叠的点),boxplot绘制箱线图
qplot(reorder(class,hwy), hwy, data = mpg, geom = c(“jitter”, “boxplot”),colour=class)

来自 http://www.douban.com/note/210735331/

 

原创文章,作者:xsmile,如若转载,请注明出处:http://www.17bigdata.com/ggplot2-%e5%ad%a6%e4%b9%a0%e7%ac%94%e8%ae%b0%ef%bc%881%ef%bc%89%ef%bc%9a%e6%96%87%e8%89%ba%e4%bd%9c%e5%9b%be%e7%b3%bb%e7%bb%9f/

更多内容请访问:IT源点

相关文章推荐

全部评论: 0

    我有话说: