Como estender a funcionalidade Texto Stringr em R
Se você já trabalhou em tudo com as funções de manipulação de texto de R, você provavelmente quer saber por que todas essas funções têm nomes imemoráveis e sintaxe aparentemente diversa. Se assim for, você não está sozinho.
Na verdade, Hadley Wickham escreveu um pacote disponível a partir de CRAN que simplifica e padroniza a trabalhar com texto em R. Este pacote é chamado stringr, e você pode instalá-lo usando o console de R ou escolhendo Pacotes de Ferramentas-Instale de rstudio.
Embora você tem que instalar um pacote somente uma vez, você tem que carregá-lo no espaço de trabalho usando o biblioteca() funcionar cada vez que você iniciar uma nova sessão R e pretende usar as funções no pacote.
install.packages ( "stringr") da biblioteca (stringr)
Aqui estão algumas das vantagens de usar stringr em vez de as funções padrão R:
Nomes de funções e argumentos são consistentes e mais descritivo. Por exemplo, todos stringr funções têm nomes começando com str_ (tal como str_detect () e str_replace ()).
stringr tem uma maneira mais consistente de lidar com casos com dados perdidos ou valores vazios.
stringr tem uma forma mais consistente de assegurar que os dados de entrada e saída são do mesmo tipo.
o stringr equivalente para grep () é str_detect (), e para o equivalente gsub () é str_replace_all ().
Como ponto de partida para explorar stringr, você pode encontrar algumas dessas funções úteis:
str_detect (): Detecta a presença ou ausência de um padrão numa cadeia
str_extract (): Extrai a primeira parte de uma cadeia que corresponde a um padrão
str_length (): Retorna o comprimento de uma cadeia (em caracteres)
str_locate (): Localiza a posição da primeira ocorrência de um padrão numa cadeia
str_match (): Extrai o primeiro grupo combinado de uma string
str_replace (): Substitui a primeira ocorrência de um padrão combinado em uma string
str_split (): Divide-se uma string em um número variável de peças
str_sub (): Extrai substrings de um vector de caracteres
str_trim (): Apara espaços em branco desde o início e final da string
str_wrap (): cordas Wraps em parágrafos bem formatados