удалить строки со значениями NA в определенном столбце

У меня огромный набор данных, содержащий около 1,6 миллиона строк, и переменная (столбец), на которой мне нужно сосредоточиться, это «температура». Столбец температуры имеет много значений NA, а другие переменные столбцы также имеют значения NA. Я хочу удалить только строки со значениями NA в столбце температуры, мне не особенно важны значения NA в других столбцах. Как я могу это сделать? Если мне в конечном итоге потребуется удалить строки со значениями NA для не только моего столбца температуры (например, столбца глубины), как я могу выбрать два столбца? Это мой код:

otn <- tidync(filename, row.names=TRUE) %>% activate('D0')
glider_table <- hyper_tibble(otn)
attach(glider_table)
summary(temperature)
na.omit(glider_table)

na.omit () удаляет все строки со значениями NA независимо от того, в каком столбце они находятся, поэтому мне нужно что-то более избирательное.

Всего 1 ответ


Вы можете использовать функцию drop_na (), первый аргумент - это имя набора данных, а второй - необязательный аргумент, в котором вы можете указать конкретные столбцы, из которых вы хотите удалить ответы NA. Вот так, drop_na (набор данных, столбец)


Есть идеи?

10000