R使用aggregate來處理註釋過後的基因列表

問題其實很簡單,在使用panther database來幫手上的基因找尋他們的功能,通常一個基因都會對應到5-6個功能,而最後希望能用一張表格來輕鬆瞭解自己找到的基因功能,處理前的資料如下:screenshot.png

希望處理後,檔案可以看起來如下面這幫

screenshot.png

實際上,這個問題使用aggregate就可以解決,輕鬆一行代碼的事情,裡面總共有三種寫法,供參考使用

#method 01
up.result.protein.function %>% aggregate(CLASS_TERM ~ ENTREZ, data=.,c)

#method 02</pre>
up.result.protein.function %>% aggregate(CLASS_TERM ~ ENTREZ, data=.,toString

#method 03
up.result.protein.function %>% aggregate(CLASS_TERM ~ ENTREZ, data=.,paste,collapse=",")
 

這問題也可以使用dplyr中的summarise來解決!

閱讀參考:
Aggregating by unique identifier and concatenating related values into a string

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s