全新第四色 使用R言语对FAERS数据库中的数据进行清洗——②数据结构先容、批量读取


发布日期:2024-12-20 06:57    点击次数:134

全新第四色 使用R言语对FAERS数据库中的数据进行清洗——②数据结构先容、批量读取

FAERS数据共分为8个表格:DEMO/DRUG/REAC/OUTC/RPSR/THER/INDI/DELETED全新第四色,差别代表病例基本而已和经管信息、药物信息、不良事件信息、患者结局、陈说开头、药物诊治运转和适度技巧、给药指征、删除的病例;primaryid看成主键连系各表。

领先面临的问题便是批量读取,批量读取ASCII文献,并批量输出为CSV相貌文献,简短后续数据处理。

底下以DEMO表的批量读取为例,才气如下:

#安设并载入tidyverse包

library(tidyverse)

#创建文献夹旅途变量path,这里需要注目,需要转变为你我方的文献夹电脑旅途

path <- "D:FAERS/FaersDataByGroup/DEMO/"

三级艳星

#索取旅途文献夹里的所有文献称呼

demo_names <- dir(path)

#设施所有文献称呼

demo_renames <- demo_names %>%全新第四色

str_to_upper() %>%

str_replace(".TXT", "")

#创建读取demo文献夹中所有文献的旅途

demo_path <- sapply(demo_names, function(x){

paste(path, x, sep = "/")

})

#读取demo文献夹中所有的文献,并复返list

demo_newdata <- lapply(demo_path, function(x){

read_delim(x, delim = "$")

})

#输出所有文献为CSV相貌,注目输出息径转变为我方的

for (i in 1:length(demo_names)) {

temp <- demo_newdata[[i]]

write_csv(temp, paste0("D: FAERS/FaersDataByGroup/DEMOCSV/", demo_renames[i], ".csv"))}

PS:

1、编程经由中,遭逢的最烦的事情便是给对象起名字,通盘系列取的名字可能比拟乱,凑合着看吧;

2、才气中所提到的旅途均为我我方的旅途,需要转变为我方的;

3、我笃定我写的才气有更简陋快速的替代,不要纠结这个,进击的是问题科罚了;对于批量读取的问题,readr2.0应该是有更简陋的主张,后续要是找到,我会发出来;

4、其余表格字据上述才气稍稍转换即可全新第四色。

本站仅提供存储奇迹,所有现实均由用户发布,如发现存害或侵权现实,请点击举报。