最新的
magick
包是为在R中更现代、更简单高质量的进行图片处理而进行的一次努力。该包封装了目前最强大的开源图片库
ImageMagick STL
。
ImageMagick
库拥有大量的功能,目前的
magick
版本实现了其中一些很适用的功能模块,但是因为是第一次发布,现在文档还比较少。本文简单的介绍了其中一些最重要的概念来帮助了解
magick
。
安装
magick
magick
在windows或者OS-X系统中,最简单的方法就是直接通过CRAN进行安装。
install.packages("magick")
二进制的CRAN包只需少量的工作,就可以使绝大多数的重要特性得以实现。
用
magick_config()
函数查看你的
ImageMagick
版本支持哪些特性和图片格式。
library(magick)
## Linking to ImageMagick 6.9.9.39
## Enabled features: cairo, fontconfig, freetype, lcms, pango, rsvg, webp
## Disabled features: fftw, ghostscript, x11
str(magick::magick_config())
## List of 21
## $ version :Class 'numeric_version' hidden list of 1
## ..$ : int [1:4] 6 9 9 39
## $ modules : logi FALSE
## $ cairo : logi TRUE
## $ fontconfig : logi TRUE
## $ freetype : logi TRUE
## $ fftw : logi FALSE
## $ ghostscript : logi FALSE
## $ jpeg : logi TRUE
## $ lcms : logi TRUE
## $ libopenjp2 : logi TRUE
## $ lzma : logi TRUE
## $ pangocairo : logi TRUE
## $ pango : logi TRUE
## $ png : logi TRUE
## $ rsvg : logi TRUE
## $ tiff : logi TRUE
## $ webp : logi TRUE
## $ wmf : logi FALSE
## $ x11 : logi FALSE
## $ xml : logi TRUE
## $ zero-configuration: logi TRUE
源代码编译安装
在Linux系统需要首先安装
ImageMagick++
库:Debian/Ubuntu系统中是
libmagick++-dev
:
sudo apt-get install libmagick++-dev
在Fedora或CentOS/RHEL系统中, 需要安装
ImageMagick-c++-devel
:
sudo yum install ImageMagick-c++-devel
在OS-X系统中,为了从源码安装,需要利用homebrew安装
imagemagick@6
。
brew reinstall imagemagick@6 --with-fontconfig --with-librsvg
brew link --force imagemagick@6
homebrew中默认的
imagemagick
配置关闭了一部分特性。建议安装时至少加上
--with-fontconfig
和
--with-librsvg
选项来支持高质量的字体和svg渲染(CRAN上的OS-Xe二进制包已经默认配置好了)。
图片输入输出
让
magick
包如此神奇的原因是它能自动转换和渲染所有常见的图片格式。
ImageMagick
支持许多格式,并自动检查类型。使用
magick_config()
函数查看你的
ImageMagick
版本支持哪些特性和图片格式。
读入和输出
图片可以通过
image_read
函数从文件路径、URL或图片原向量(raw vector)直接读取,
image_info
函数会输出一些图片的元数据(meta data),和
imagemagick
命令行中
identify
命令作用相同。
library(magick)
tiger <- image_read_svg('http://jeroen.github.io/images/tiger.svg', width = 400)
print(tiger)
## format width height colorspace matte filesize density
## 1 PNG 400 400 sRGB TRUE 0 72x72
我们可以使用
image_write
函数以任何格式将图片输出到本地硬盘,或当
path = NULL
(不指定路径)时输出到内存上。
# 渲染 svg 为 png 位图
image_write(tiger, path = "tiger.png", format = "png")
若
path
是文件名,
image_write
执行成功则返回
path
,这让结果可以通过管道(pipe)传递给其他函数使用。
转换格式
magick
在内存中按图片原格式进行存储,通过设置
image_write
函数中的
format
参数可以转换为其他格式。也可以在执行其他变换之前内在地进行格式转换。这当你不知道图片格式时尤其有用。
tiger_png <- image_convert(tiger, "png")
image_info(tiger_png)
## format width height colorspace matte filesize density
## 1 PNG 400 400 sRGB TRUE 0 72x72
注意,此时图片大小(size)为0,因为
imagemagick
是惰性加载原则,直到被使用之前都不会被渲染。
预览
拥有内置浏览器的集成编辑器(例如Rstudio)会在viewer中自动显示
magick
图片。也可以将结果巧妙的放在一个交互的图片编辑环境中。
此外,Linux系统可以使用
image_display
函数在
X11
窗口中预览。
image_browse
会通过系统中默认应用来打开图片。
# 仅支持X11
image_display(tiger)
# 系统依赖
image_browse(tiger)
另一种方法是把图片转换为栅格图,然后在R图形设备上绘制后进行显示。这种方法非常慢,仅仅在合并其他图形时比较有用。请查看后文#raster 。
转化
了解可用的转化的最佳途径是在RStudio中浏览
?transformations
帮助页面中的示例。 下面举几个例子来了解什么是可以实现的。
裁剪和编辑
一些转换函数中有
geometry
参数,该参数需要一个特殊的语法形式为
AxB + C + D
,其中每个元素都是可选的。 例子:
-
image_crop(image, "100x150+50")
:
crop out
width:100px
and
height:150px
starting
+50px
from the left
-
image_scale(image, "200")
:
resize proportionally to width:
200px
-
image_scale(image, "x200")
:
resize proportionally to height:
200px
-
image_fill(image, "blue", "+100+200")
:
flood fill with blue starting at the point at
x:100, y:200
-
image_border(frink, "red", "20x10")
:
adds a border of 20px left+right and 10px top+bottom
完整的语法设置请查看
Magick::Geometry
文档.
# 示例图片
frink <- image_read("https://jeroen.github.io/images/frink.png")
print(frink)
## format width height colorspace matte filesize density
## 1 PNG 220 445 sRGB TRUE 73494 72x72
# 左右两侧、上下两侧分别添加20像素、10像素边框
image_border(image_background(frink, "hotpink"), "#000080", "20x10")
# 去掉边框
image_trim(frink)
# Passport pica
image_crop(frink, "100x150+50")
# Resize
image_scale(frink, "300") # width: 300px
image_scale(frink, "x300") # height: 300px
# Rotate or mirror
image_rotate(frink, 45)
image_flip(frink)
image_flop(frink)
# Brightness, Saturation, Hue
image_modulate(frink, brightness = 80, saturation = 120, hue = 90)
# Paint the shirt orange
image_fill(frink, "orange", point = "+100+200", fuzz = 20)
使用
image_fill
我们可以从像素点
point
开始填充。
fuzz
参数允许以相同的颜色填充相邻的像素。 值必须在0到256^2之间,指距离之间之间的颜色是等同的。 在这里,我们给教授frink橙色衬衫世界杯。
滤镜和特效
ImageMagick还有一堆值得了解的标准特效。
# Add randomness
image_blur(frink, 10, 5)
image_noise(frink)
# Silly filters
image_charcoal(frink)
image_oilpaint(frink)
image_negate(frink)
核卷积(Kernel convolution)
image_convolve()
函数在全图上实行
kernel
变换。和卷积是指在核矩阵中,图片每个像素的值根据相邻像素的加权和重新计算。例如,看下以下简单核变换:
kern <- matrix(0, ncol = 3, nrow = 3)
kern[1, 2] <- 0.25
kern[2, c(1, 3)] <- 0.25
kern[3, 2] <- 0.25
kern
## [,1] [,2] [,3]
## [1,] 0.00 0.25 0.00
## [2,] 0.25 0.00 0.25
## [3,] 0.00 0.25 0.00
核变换将每个像素的值变为其水平和垂直相邻像素的平均值,这会在下面的右侧图像中产生轻微的模糊效果:
img <- image_resize(logo, "300x300")
img_blurred <- image_convolve(img, kern)
image_append(c(img, img_blurred))
或使用其他任何
标准核
img %>% image_convolve('Sobel') %>% image_negate()
img %>% image_convolve('DoG:0,0,2') %>% image_negate()
文本注释
最后,在图片上输出一些文本往往是十分有用的:
# Add some text
image_annotate(frink, "I like R!", size = 70, gravity = "southwest", color = "green")
# Customize text
image_annotate(frink, "CONFIDENTIAL", size = 30, color = "red", boxcolor = "pink",
degrees = 60, location = "+50+100")
# Fonts may require ImageMagick has fontconfig
image_annotate(frink, "The quick brown fox", font = 'Times', size = 30)
大多数平台支持的字体包括
"sans"
、
"mono"
、
"serif"
、
"Times"
、
"Helvetica"
、
"Trebuchet"
、
"Georgia"
、
"Palatino"
、
"Comic Sans"
。
结合管道技术
每个图像变换函数返回原始图像的
修改副本
。 它不会影响原始图像。
frink <- image_read("https://jeroen.github.io/images/frink.png")
frink2 <- image_scale(frink, "100")
image_info(frink)
## format width height colorspace matte filesize density
## 1 PNG 220 445 sRGB TRUE 73494 72x72
image_info(frink2)
## format width height colorspace matte filesize density
## 1 PNG 100 202 sRGB TRUE 0 72x72
因此,要组合转换,需要链接它们:
test <- image_rotate(frink, 90)
test <- image_background(test, "blue", flatten = TRUE)
test <- image_border(test, "red", "10x10")
test <- image_annotate(test, "This is how we combine transformations", color = "white", size = 30)
print(test)
## format width height colorspace matte filesize density
## 1 PNG 465 240 sRGB TRUE 0 72x72
使用
magrittr
的管道语法会让这一过程更具可读性。
image_read("https://jeroen.github.io/images/frink.png") %>%
image_rotate(270) %>%
image_background("blue", flatten = TRUE) %>%
image_border("red", "10x10") %>%
image_annotate("The same thing with pipes", color = "white", size = 30)
图片向量
以上示例涉及单个图像。然而,magick中的所有函数都已经过向量化了,以支持使用图层,组合或动画。
标准基本方法
[``[[
,
c()
和
length()
用于处理图像向量,然后可以将其视为图层或帧。
# Download earth gif and make it a bit smaller for vignette
earth <- image_read("https://jeroen.github.io/images/earth.gif") %>%
image_scale("200x") %>%
image_quantize(128)
length(earth)
## [1] 44
earth
head(image_info(earth))
## format width height colorspace matte filesize density
## 1 GIF 200 200 RGB FALSE 0 72x72
## 2 GIF 200 200 RGB FALSE 0 72x72
## 3 GIF 200 200 RGB FALSE 0 72x72
## 4 GIF 200 200 RGB FALSE 0 72x72
## 5 GIF 200 200 RGB FALSE 0 72x72
## 6 GIF 200 200 RGB FALSE 0 72x72
rev(earth) %>%
image_flip() %>%
image_annotate("meanwhile in Australia", size = 20, color = "white")
图层
我们可以像在Photoshop中一样堆叠彼此叠加的图层:
bigdata <- image_read('https://jeroen.github.io/images/bigdata.jpg')
frink <- image_read("https://jeroen.github.io/images/frink.png")
logo <- image_read("https://jeroen.github.io/images/Rlogo.png")
img <- c(bigdata, logo, frink)
img <- image_scale(img, "300x300")
image_info(img)
## format width height colorspace matte filesize density
## 1 JPEG 300 225 sRGB FALSE 0 72x72
## 2 PNG 300 232 sRGB TRUE 0 72x72
## 3 PNG 148 300 sRGB TRUE 0 72x72
马赛克将图像添加在其他图片上,扩展输出画布来使整个图片更合适:
image_mosaic(img)
扁平地将图层组合成单个图片,该图具有第一个图像一样的大小:
image_flatten(img)
扁平合并和马赛克允许指定替代方案
composite operators
:
image_flatten(img, 'Add')
image_flatten(img, 'Modulate')
image_flatten(img, 'Minus')
合并
附加(appending)意味着简单地将图片水平合并到一起:
image_append(image_scale(img, "x200"))
用
stack = TRUE
参数将所有图片垂直堆叠加到一起:
image_append(image_scale(img, "100"), stack = TRUE)
允许在特定位置组合两个图像:
bigdatafrink <- image_scale(image_rotate(image_background(frink, "none"), 300), "x200")
image_composite(image_scale(bigdata, "x400"), bigdatafrink, offset = "+180+100")
文档页
在读取PDF文档时,每个页面都成为向量的元素。请注意,PDF会在读取时呈现,因此需要直接指定密度(density)。
manual <- image_read_pdf('https://cloud.r-project.org/web/packages/magick/magick.pdf', density = 72)
image_info(manual)
## format width height colorspace matte filesize density
## 1 PNG 612 792 sRGB TRUE 0 72x72
## 2 PNG 612 792 sRGB TRUE 0 72x72
## 3 PNG 612 792 sRGB TRUE 0 72x72
## 4 PNG 612 792 sRGB TRUE 0 72x72
## 5 PNG 612 792 sRGB TRUE 0 72x72
## 6 PNG 612 792 sRGB TRUE 0 72x72
## 7 PNG 612 792 sRGB TRUE 0 72x72
## 8 PNG 612 792 sRGB TRUE 0 72x72
## 9 PNG 612 792 sRGB TRUE 0 72x72
## 10 PNG 612 792 sRGB TRUE 0 72x72
## 11 PNG 612 792 sRGB TRUE 0 72x72
## 12 PNG 612 792 sRGB TRUE 0 72x72
## 13 PNG 612 792 sRGB TRUE 0 72x72
## 14 PNG 612 792 sRGB TRUE 0 72x72
## 15 PNG 612 792 sRGB TRUE 0 72x72
## 16 PNG 612 792 sRGB TRUE 0 72x72
## 17 PNG 612 792 sRGB TRUE 0 72x72
## 18 PNG 612 792 sRGB TRUE 0 72x72
## 19 PNG 612 792 sRGB TRUE 0 72x72
## 20 PNG 612 792 sRGB TRUE 0 72x72
## 21 PNG 612 792 sRGB TRUE 0 72x72
## 22 PNG 612 792 sRGB TRUE 0 72x72
## 23 PNG 612 792 sRGB TRUE 0 72x72
## 24 PNG 612 792 sRGB TRUE 0 72x72
## 25 PNG 612 792 sRGB TRUE 0 72x72
## 26 PNG 612 792 sRGB TRUE 0 72x72
## 27 PNG 612 792 sRGB TRUE 0 72x72
## 28 PNG 612 792 sRGB TRUE 0 72x72
## 29 PNG 612 792 sRGB TRUE 0 72x72
manual[1]
动画
不仅可以图片向量元素视为图层,还可以称为动画中的帧。
image_animate(image_scale(img, "200x200"), fps = 1, dispose = "previous")
image_morph
生成了一个
n
幅图片的序列,这些序列将一幅图变形到另一幅图上,生成动画:
newlogo <- image_scale(image_read("https://jeroen.github.io/images/Rlogo.png"), "x150")
oldlogo <- image_scale(image_read("https://developer.r-project.org/Logo/Rlogo-3.png"), "x150")
frames <- image_morph(c(oldlogo, newlogo), frames = 10)
image_animate(frames)
如果你读取已存在的GIF或视频文件,每帧都会转为图层:
# Foreground image
banana <- image_read("https://jeroen.github.io/images/banana.gif")
banana <- image_scale(banana, "150")
image_info(banana)
## format width height colorspace matte filesize density
## 1 GIF 150 148 sRGB TRUE 0 72x72
## 2 GIF 150 148 sRGB TRUE 0 72x72
## 3 GIF 150 148 sRGB TRUE 0 72x72
## 4 GIF 150 148 sRGB TRUE 0 72x72
## 5 GIF 150 148 sRGB TRUE 0 72x72
## 6 GIF 150 148 sRGB TRUE 0 72x72
## 7 GIF 150 148 sRGB TRUE 0 72x72
## 8 GIF 150 148 sRGB TRUE 0 72x72
操作单独的图帧,然后放回到原来的动画中:
# Background image
background <- image_background(image_scale(logo, "200"), "white", flatten = TRUE)
# Combine and flatten frames
frames <- image_composite(background, banana, offset = "+70+30")
# Turn frames into animation
animation <- image_animate(frames, fps = 10)
print(animation)
## format width height colorspace matte filesize density
## 1 gif 200 155 sRGB TRUE 0 72x72
## 2 gif 200 155 sRGB TRUE 0 72x72
## 3 gif 200 155 sRGB TRUE 0 72x72
## 4 gif 200 155 sRGB TRUE 0 72x72
## 5 gif 200 155 sRGB TRUE 0 72x72
## 6 gif 200 155 sRGB TRUE 0 72x72
## 7 gif 200 155 sRGB TRUE 0 72x72
## 8 gif 200 155 sRGB TRUE 0 72x72
动画可以保存为MPEG格式的GIF:
image_write(animation, "Rlogo-banana.gif")
绘图和图形设备
一个相对较新的附加功能是提供了一个本地图形设备,能生成magick图对象。这可以像常规设备一样用于绘图,或者打开一个图形设备,用像素坐标将图绘制到现有图片上。
图形设备
image_graph()
函数和
png()
、
x11()
函数一样,打开一个新的图形设备。它返回一个图对象到
plot(s)
函数输出。绘图设备的每一页都成为图对象的一帧。
# Produce image using graphics device
fig <- image_graph(width = 400, height = 400, res = 96)
ggplot2::qplot(mpg, wt, data = mtcars, colour = cyl)
dev.off()
可以轻松的使用常规图片操作进行图的后期处理。
# Combine
out <- image_composite(fig, frink, offset = "+70+30")
print(out)
## format width height colorspace matte filesize density
## 1 PNG 400 400 sRGB TRUE 0 72x72
绘图设备
使用图形设备的另一种方法是用像素坐标在现有图像上绘图。
# Or paint over an existing image
img <- image_draw(frink)
rect(20, 20, 200, 100, border = "red", lty = "dashed", lwd = 5)
abline(h = 300, col = 'blue', lwd = '10', lty = "dotted")
text(30, 250, "Hoiven-Glaven", family = "monospace", cex = 4, srt = 90)
palette(rainbow(11, end = 0.9))
symbols(rep(200, 11), seq(0, 400, 40), circles = runif(11, 5, 35),
bg = 1:11, inches = FALSE, add = TRUE)
dev.off()
print(img)
## format width height colorspace matte filesize density
## 1 PNG 220 445 sRGB TRUE 0 72x72
默认情况下,
image_draw()
将所有边距设置为0,并使用图形坐标来匹配图像大小(以像素为单位)(宽度x高度),其中(0,0)是左上角。 请注意,这意味着y轴从顶部到底部增加,这与典型的图形坐标相反。 您可以通过将自定义
xlim
,
ylim
或
mar
值传递给
image_draw
来覆盖所有这些默认设置。
动画图设备
图形设备支持多个帧,可以轻松创建动画图形。 下面的代码显示了如何使用magick图形设备来实现非常酷的[gganimate](
https://github.com/dgrtwo/gganimate)包中的示例
。
library(gapminder)
library(ggplot2)
img <- image_graph(600, 340, res = 96)
datalist <- split(gapminder, gapminder$year)
out <- lapply(datalist, function(data){
p <- ggplot(data, aes(gdpPercap, lifeExp, size = pop, color = continent)) +
scale_size("population", limits = range(gapminder$pop)) + geom_point() + ylim(20, 90) +
scale_x_log10(limits = range(gapminder$gdpPercap)) + ggtitle(data$year) + theme_classic()
print(p)
})
dev.off()
animation <- image_animate(img, fps = 2)
print(animation)
## format width height colorspace matte filesize density
## 1 gif 600 340 sRGB TRUE 0 72x72
## 2 gif 600 340 sRGB TRUE 0 72x72
## 3 gif 600 340 sRGB TRUE 0 72x72
## 4 gif 600 340 sRGB TRUE 0 72x72
## 5 gif 600 340 sRGB TRUE 0 72x72
## 6 gif 600 340 sRGB TRUE 0 72x72
## 7 gif 600 340 sRGB TRUE 0 72x72
## 8 gif 600 340 sRGB TRUE 0 72x72
## 9 gif 600 340 sRGB TRUE 0 72x72
## 10 gif 600 340 sRGB TRUE 0 72x72
## 11 gif 600 340 sRGB TRUE 0 72x72
## 12 gif 600 340 sRGB TRUE 0 72x72
将它写入文件你可以:
image_write(animation, "gapminder.gif")
栅格图
Magick图像也可以转换为栅格对象,以便与R的图形设备一起使用。 因此我们可以将它与其他图形工具结合起来。 但是要注意R的图形设备非常慢并且具有非常不同的坐标系统,这降低了图像的质量。
R自带的栅格函数
R 有一个
as.raster
函数,能将图片转换为字符串向量。Paul Murrell的这篇文章
Raster Images in R Graphics
做了一个很好的回顾。
plot(as.raster(frink))
# Print over another graphic
plot(cars)
rasterImage(frink, 21, 0, 25, 80)
grid
包
grid
grid
包可以更轻松地在图形设备上叠加栅格,而无需调整绘图的x / y坐标
library(ggplot2)
library(grid)
qplot(speed, dist, data = cars, geom = c("point", "smooth"))
grid.raster(frink)
raster
包
raster
raster
包有自己的位图类,对空间应用程序很有用。将图像转换为栅格的最简单方法是将其导出为
tiff
文件:
tiff_file <- tempfile()
image_write(frink, path = tiff_file, format = 'tiff')
r <- raster::brick(tiff_file)
raster::plotRGB(r)
也可以手动将位图数组转换为栅格对象,但这似乎会丢失一些元数据:
buf <- as.integer(frink[[1]])
rr <- raster::brick(buf)
raster::plotRGB(rr, asp = 1)
光栅包似乎也不支持透明度,而这在空间成像的背景下可能是有意义的。
OCR 文本提取
magick
最新的功能是利用OCR技术从图片中提取文本。这需要
tesseract
包。
install.packages("tesseract")
img <- image_read("http://jeroen.github.io/images/testocr.png")
print(img)
## format width height colorspace matte filesize density
## 1 PNG 640 480 sRGB TRUE 23359 72x72
# Extract text
cat(image_ocr(img))
## This is a lot of 12 point text to test the
## cor code and see if it works on all types
## of file format.
##
## The quick brown dog jumped over the
## lazy fox. The quick brown dog jumped
## over the lazy fox. The quick brown dog
## jumped over the lazy fox. The quick
## brown dog jumped over the lazy fox.