Como estender a funcionalidade Texto Stringr em R

Se você já trabalhou em tudo com as funções de manipulação de texto de R, você provavelmente quer saber por que todas essas funções têm nomes imemoráveis ​​e sintaxe aparentemente diversa. Se assim for, você não está sozinho.

Na verdade, Hadley Wickham escreveu um pacote disponível a partir de CRAN que simplifica e padroniza a trabalhar com texto em R. Este pacote é chamado stringr, e você pode instalá-lo usando o console de R ou escolhendo Pacotes de Ferramentas-Instale de rstudio.

Embora você tem que instalar um pacote somente uma vez, você tem que carregá-lo no espaço de trabalho usando o biblioteca() funcionar cada vez que você iniciar uma nova sessão R e pretende usar as funções no pacote.

install.packages ( "stringr") da biblioteca (stringr)

Aqui estão algumas das vantagens de usar stringr em vez de as funções padrão R:

  • Nomes de funções e argumentos são consistentes e mais descritivo. Por exemplo, todos stringr funções têm nomes começando com str_ (tal como str_detect () e str_replace ()).

  • stringr tem uma maneira mais consistente de lidar com casos com dados perdidos ou valores vazios.

  • stringr tem uma forma mais consistente de assegurar que os dados de entrada e saída são do mesmo tipo.

o stringr equivalente para grep () é str_detect (), e para o equivalente gsub () é str_replace_all ().

Como ponto de partida para explorar stringr, você pode encontrar algumas dessas funções úteis:

  • str_detect (): Detecta a presença ou ausência de um padrão numa cadeia

  • str_extract (): Extrai a primeira parte de uma cadeia que corresponde a um padrão

  • str_length (): Retorna o comprimento de uma cadeia (em caracteres)

  • str_locate (): Localiza a posição da primeira ocorrência de um padrão numa cadeia

  • str_match (): Extrai o primeiro grupo combinado de uma string

  • str_replace (): Substitui a primeira ocorrência de um padrão combinado em uma string

  • str_split (): Divide-se uma string em um número variável de peças

  • str_sub (): Extrai substrings de um vector de caracteres

  • str_trim (): Apara espaços em branco desde o início e final da string

  • str_wrap (): cordas Wraps em parágrafos bem formatados

menu