条形图
2018-09-03
2018-09-03
---
title: "条形图"
output:
html_document:
number_sections: TRUE
toc: TRUE
toc_float: TRUE
code_folding: show
fig_width: 7
fig_height: 4.5
theme: united
highlight: tango
---
# 数据准备
***
该数据是从净水器文本数据中提取频率最高的词语,并对其进行词频统计。
```{r}
pinshu=read.csv("F:/标题10.分词.csv") ##导入csv数据
str(pinshu)
```
该数据有10条数据量,2个变量(字段),分别为频数和分词。
```{r}
col4 = "dimgrey" ##某一种灰色
pp=pinshu[order(-pinshu$Freq),] #对分词进行排序
分词 = factor(pp$fenci,levels = pp$fenci)
频数 = pp$Freq #查看分词的频数
df = data.frame(x = 分词, y = 频数)
```
# 绘制条形图
***
## 绘制频数条形图
1.参数fill为图形的填充色
2.参数colour为图形边框线
3.geom_ 指定是制作点图还是柱状图
```{r,echo=TRUE,message=FALSE,warning=FALSE}
library(ggplot2)
ggplot(df,aes(x=分词,y=频数)) + geom_bar(stat = 'identity',fill=col4)+
labs(x="标题关键词") + geom_text(aes(label = 频数), vjust = 1.5, colour = "white", position = position_dodge(.9), size = 5)
```
以标题描述提取的关键词为例,可以发现净水器、家用、厨房等词所占频次最高。
## 绘制簇状条形图
该数据集的变量主要包含有品种,重量,标准差,样本量,标准误差等。这种数据集的目的是使其易于使用图形。
```{r,echo=TRUE,message=FALSE,warning=FALSE}
library(gcookbook) #加载包
str(cabbage_exp)#查看数据结构信息
```
```{r,echo=FALSE,message=FALSE,warning=FALSE}
library(knitr) # 加载knitr包,使用kable函数,使得表格更加美观
library(readxl)
data=read_excel("D:/TASK/卷心菜.xlsx")
kable(head(data ,6))
```
簇状条形图比较各个类别的值。在簇状条形图中,通常沿垂直轴组织类别,而沿水平轴组织数值。
```{r,echo=TRUE,message=FALSE,warning=FALSE}
ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar))+
geom_bar(position="dodge",stat="identity",colour="black") +
scale_fill_brewer(palette="Pastell")
```
从簇状条形图来看,色系为浅绿色的是品种c39,深绿色为品种c52。品种为c39的的重量明显比品种为c52的重量大,时间越长,品种为c39的品种的重量越低。
##堆积条形图
堆积条形图显示单个项目与整体之间的关系。
```{r}
ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar))+geom_bar(stat="identity")
```
从上面的堆积条形图来看,是将品种c39和c52堆积在一起,其中红色为c39,蓝色为品种c52。在时间为16和21天时品种c39明显比c52重量大。
```{r}
par(mfrow=c(3,2))
library(ggplot2)
with(mpg,table(class,year))
p <- ggplot(data=mpg,aes(x=class,fill=factor(year)))
p + geom_bar(position='dodge')
p + geom_bar(position='stack')
p + geom_bar(position='fill')
p + geom_bar(position='identity',alpha=0.3)
```
# 本章汇总
***
```{r,echo=FALSE,message=FALSE,warning=FALSE}
library(knitr) # 加载knitr包,使用kable函数,使得表格更加美观
library(readxl)
data=read_excel("D:/TASK/参数/条形图参数.xlsx")
kable(head(data ,9))
```