R資料處理小技巧:使用dplyr的filter加上stringr的str_detect,可以用來過濾複雜文字資料

有時候在處理一些資料,其特定欄位的描述是很文字的時候,此時可以將dplyr中的filter搭配上stringr包裡頭的str_detect來處理,可以發揮很好的效果,這邊舉例來說明。

下面這筆資料,假如我想要知道有幾個人他的姓名中含有“秀”的

screenshot.png

那麼這類問題就可以用這種搭配來解決,可看下面的代碼

library(dplyr)
library(stringr)
data %>% filter(str_detect(`<code>人名`,"秀"</code>)) %>% summarise(number=n())

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s