全新第四色使用R言语对FAERS数据库中的数据进行清洗——②数据结构先容、批量读取

发布日期：2024-12-20 06:57 点击次数：134

FAERS数据共分为8个表格：DEMO/DRUG/REAC/OUTC/RPSR/THER/INDI/DELETED全新第四色，差别代表病例基本而已和经管信息、药物信息、不良事件信息、患者结局、陈说开头、药物诊治运转和适度技巧、给药指征、删除的病例；primaryid看成主键连系各表。

领先面临的问题便是批量读取，批量读取ASCII文献，并批量输出为CSV相貌文献，简短后续数据处理。

底下以DEMO表的批量读取为例，才气如下：

#安设并载入tidyverse包

library(tidyverse)

#创建文献夹旅途变量path，这里需要注目，需要转变为你我方的文献夹电脑旅途

path <- "D:FAERS/FaersDataByGroup/DEMO/"

#索取旅途文献夹里的所有文献称呼

demo_names <- dir(path)

#设施所有文献称呼

demo_renames <- demo_names %>%全新第四色

str_to_upper() %>%

str_replace(".TXT"， "")

#创建读取demo文献夹中所有文献的旅途

demo_path <- sapply(demo_names， function(x){

paste(path， x， sep = "/")

})

#读取demo文献夹中所有的文献，并复返list

demo_newdata <- lapply(demo_path， function(x){

read_delim(x， delim = "$")

})

#输出所有文献为CSV相貌，注目输出息径转变为我方的

for (i in 1:length(demo_names)) {

temp <- demo_newdata[[i]]

write_csv(temp， paste0("D: FAERS/FaersDataByGroup/DEMOCSV/"， demo_renames[i]， ".csv"))}

PS：

1、编程经由中，遭逢的最烦的事情便是给对象起名字，通盘系列取的名字可能比拟乱，凑合着看吧；

2、才气中所提到的旅途均为我我方的旅途，需要转变为我方的；

3、我笃定我写的才气有更简陋快速的替代，不要纠结这个，进击的是问题科罚了；对于批量读取的问题，readr2.0应该是有更简陋的主张，后续要是找到，我会发出来；

4、其余表格字据上述才气稍稍转换即可全新第四色。

本站仅提供存储奇迹，所有现实均由用户发布，如发现存害或侵权现实，请点击举报。