FAERS数据共分为8个表格:DEMO/DRUG/REAC/OUTC/RPSR/THER/INDI/DELETED全新第四色,差别代表病例基本而已和经管信息、药物信息、不良事件信息、患者结局、陈说开头、药物诊治运转和适度技巧、给药指征、删除的病例;primaryid看成主键连系各表。
领先面临的问题便是批量读取,批量读取ASCII文献,并批量输出为CSV相貌文献,简短后续数据处理。
底下以DEMO表的批量读取为例,才气如下:
#安设并载入tidyverse包
library(tidyverse)
#创建文献夹旅途变量path,这里需要注目,需要转变为你我方的文献夹电脑旅途
path <- "D:FAERS/FaersDataByGroup/DEMO/"
三级艳星#索取旅途文献夹里的所有文献称呼
demo_names <- dir(path)
#设施所有文献称呼
demo_renames <- demo_names %>%全新第四色
str_to_upper() %>%
str_replace(".TXT", "")
#创建读取demo文献夹中所有文献的旅途
demo_path <- sapply(demo_names, function(x){
paste(path, x, sep = "/")
})
#读取demo文献夹中所有的文献,并复返list
demo_newdata <- lapply(demo_path, function(x){
read_delim(x, delim = "$")
})
#输出所有文献为CSV相貌,注目输出息径转变为我方的
for (i in 1:length(demo_names)) {
temp <- demo_newdata[[i]]
write_csv(temp, paste0("D: FAERS/FaersDataByGroup/DEMOCSV/", demo_renames[i], ".csv"))}
PS:
1、编程经由中,遭逢的最烦的事情便是给对象起名字,通盘系列取的名字可能比拟乱,凑合着看吧;
2、才气中所提到的旅途均为我我方的旅途,需要转变为我方的;
3、我笃定我写的才气有更简陋快速的替代,不要纠结这个,进击的是问题科罚了;对于批量读取的问题,readr2.0应该是有更简陋的主张,后续要是找到,我会发出来;
4、其余表格字据上述才气稍稍转换即可全新第四色。
本站仅提供存储奇迹,所有现实均由用户发布,如发现存害或侵权现实,请点击举报。