Изменить слова, начинающиеся с шаблона [дубликата]

Я анализирую политическую речь и хочу стандартизировать некоторые диалектные слова. Я хочу изменить все слова, начинающиеся с «fra», чтобы они начинались с «fre».

Пример:

«Фред вошел в бар» становится «Фред вошел в бар»

"ты фред" становится "ты фред"

«ты боишься» не должен меняться и оставаться прежним

Как мне сделать это в R?

Речи хранятся во фрейме данных вместе с некоторыми метаданными, где переменный текст хранит речь для каждого политика в течение года.

Всего 1 ответ


То, что вы ищете, называется регулярными выражениями:

text <- c("frad walked into a bar", "are you frad", "are you afraid")

gsub("\bfra", "fre", text)
#> [1] "fred walked into a bar" "are you fred"           "are you afraid"

В этом случае \b означает начало или конец слова. Вы можете использовать этот шпаргалку, чтобы узнать больше или найти другой хороший ресурс.


Есть идеи?

10000