Я анализирую политическую речь и хочу стандартизировать некоторые диалектные слова. Я хочу изменить все слова, начинающиеся с «fra», чтобы они начинались с «fre».
Пример:
«Фред вошел в бар» становится «Фред вошел в бар»
"ты фред" становится "ты фред"
«ты боишься» не должен меняться и оставаться прежним
Как мне сделать это в R?
Речи хранятся во фрейме данных вместе с некоторыми метаданными, где переменный текст хранит речь для каждого политика в течение года.
Всего 1 ответ
То, что вы ищете, называется регулярными выражениями:
text <- c("frad walked into a bar", "are you frad", "are you afraid")
gsub("\bfra", "fre", text)
#> [1] "fred walked into a bar" "are you fred" "are you afraid"
В этом случае \b
означает начало или конец слова. Вы можете использовать этот шпаргалку, чтобы узнать больше или найти другой хороший ресурс.