問題其實很簡單,在使用panther database來幫手上的基因找尋他們的功能,通常一個基因都會對應到5-6個功能,而最後希望能用一張表格來輕鬆瞭解自己找到的基因功能,處理前的資料如下:
希望處理後,檔案可以看起來如下面這幫
實際上,這個問題使用aggregate就可以解決,輕鬆一行代碼的事情,裡面總共有三種寫法,供參考使用
#method 01 up.result.protein.function %>% aggregate(CLASS_TERM ~ ENTREZ, data=.,c) #method 02</pre> up.result.protein.function %>% aggregate(CLASS_TERM ~ ENTREZ, data=.,toString #method 03 up.result.protein.function %>% aggregate(CLASS_TERM ~ ENTREZ, data=.,paste,collapse=",")
這問題也可以使用dplyr中的summarise來解決!
閱讀參考:
Aggregating by unique identifier and concatenating related values into a string