Strings são es­tru­tu­ras de dados es­sen­ci­ais da pro­gra­ma­ção. Elas são usadas para exibir sequên­cias de ca­rac­te­res e letras in­di­vi­du­al­mente, ou seja, dados textuais. Ao contrário de outras, a linguagem de pro­gra­ma­ção R não possui um tipo de dado chamado “string” — na verdade, esse tipo de dado em R é conhecido como “character”.

O que é string em R?

String é uma estrutura de dado padrão, adotada pelas mais diversas lin­gua­gens de pro­gra­ma­ção e que todos os pro­gra­ma­do­res ex­pe­ri­en­tes devem saber usar. Se você está em processo de aprender a programar, é de fun­da­men­tal im­por­tân­cia que com­pre­enda o que é uma string, para que possa aplicá-la aos seus códigos.

Em essência, strings são sim­ples­mente sequên­cias de ca­rac­te­res comumente usadas para armazenar e processar dados não numéricos em códigos. Assim como em outras lin­gua­gens, strings devem ser usadas entre aspas simples ou duplas pela pro­gra­ma­ção em R.

Como criar strings em R

É possível criar uma R string com uma única linha de código. Tanto aspas simples quanto aspas duplas podem ser usadas na criação de strings. A escolha fica a critério do de­sen­vol­ve­dor.

# String with double quotation marks
string1 <- "Hello world!"
# String with single quotation marks
string2 <- 'Hello world!'
R

Como usar funções e operações em strings em R

A linguagem de pro­gra­ma­ção R oferece aos de­sen­vol­ve­do­res um conjunto de funções básicas que tornam a ma­ni­pu­la­ção de dados mais eficiente. Strings, por exemplo, podem ser usadas para realizar diversas operações, tanto nas próprias strings quanto em strings com­bi­na­das. Conheça as operações mais im­por­tan­tes que podem ser re­a­li­za­das em R strings:

  • substr(): Extrai uma porção de uma string
  • paste(): Concatena strings
  • tolower() / toupper(): Converte todas as letras de uma string em mi­nús­cu­las ou maiús­cu­las
  • strsplit(): Divide uma string em um ponto es­pe­cí­fico
  • trimws(): Remove espaços em branco no começo e no final de uma string
  • gsub(): Substitui padrões em uma string com outros ca­rac­te­res
  • nchar(): Calcula o com­pri­mento de uma string

Se você já trabalha com outras lin­gua­gens de pro­gra­ma­ção, pro­va­vel­mente conhece funções se­me­lhan­tes às listadas. Por exemplo, strings em Python também podem ser ma­ni­pu­la­das por operações equi­va­len­tes às acima apre­sen­ta­das.

substr()

A função substr() extrai subs­trings de uma string em R. Para fazer isso, insira a string na função como o primeiro parâmetro. Nos segundo e terceiro pa­râ­me­tros, es­pe­ci­fi­que os índices de início e final da substring que você deseja extrair. Lembre-se de que, ao contrário de outras lin­gua­gens de pro­gra­ma­ção, o índice de uma R string começa com 1, e não com 0.

string <- "Hello World"
print(substr(string, start=7, stop=11))
R

O exemplo acima retorna, como resultado, a string World.

paste()

A função paste() é usada na linguagem de pro­gra­ma­ção R para juntar duas ou mais strings — processo conhecido como con­ca­te­na­ção. Observe, contudo, que o símbolo + não deve ser usado para con­ca­te­nar strings. O operador em R + pode ser usado apenas em tipos de dados numéricos.

string <- "Hello"
string2 <- "World"
print(paste(string+ string2))
R

Quando a função paste() é chamada, as cadeias de ca­rac­te­res string e string2 são con­ca­te­na­das, o que resulta em: Hello World.

tolower() / toupper()

Com as funções tolower() e toupper(), você pode alterar todas as letras de uma string, tornando-as mi­nús­cu­las ou maiús­cu­las. Use, como parâmetro de ambas as funções, a string que você deseja mudar. Ao ser executada, a função apre­sen­tará uma nova string com todas as letras mi­nús­cu­las ou maiús­cu­las.

string <- "Hello World"
print(tolower(string))
print(toupper(string))
R

O código acima exibirá como resultado hello world e HELLO WORLD. Essas duas funções de strings em R são es­pe­ci­al­mente úteis para gerenciar dados que devem ser pro­ces­sa­dos di­fe­ren­ci­ando-se mi­nús­cu­las e maiús­cu­las.

strsplit()

A função strsplit(), também aplicável à linguagem de pro­gra­ma­ção R, já é conhecida de de­sen­vol­ve­do­res ex­pe­ri­en­tes. Por exemplo, a função split() em Python funciona da mesma forma. Quando usada em R, a função strsplit() utiliza strings como pa­râ­me­tros, para divisões em subs­trings. O de­li­mi­ta­dor, por sua vez, definirá em que ponto a string deverá ser quebrada. Quando a função é chamada, ela retorna uma lista com as subs­trings criadas, mesmo se houver apenas uma.

string <- "Hello World"
print(strsplit(string, " "))
R

O código produz o seguinte resultado:

[[1]]
[1] "Hello" "World"

O resultado acima exibe uma lista com duas strings: "Hello" e "World". No exemplo, o espaço entre as duas palavras foi usado como de­li­mi­ta­dor.

trimws()

Ao fazer uso da função trimws(), você remove espaços em branco in­de­se­ja­dos, tanto no começo quanto no fim de uma string em R. Esse recurso é es­pe­ci­al­mente útil no pro­ces­sa­mento de for­mu­lá­rios pre­en­chi­dos por usuários que adi­ci­o­na­ram espaços em branco aci­den­tal­mente.

string <- "   Hello World   "
print(trimws(string))
R

O código acima exibirá, como resultado, Hello World sem os espaços em branco do começo e do fim da string.

gsub()

A função gsub() de­sem­pe­nha outro tipo de operação em strings em R. Ela adota a substring a ser subs­ti­tuída como primeiro parâmetro. O segundo, por sua vez, será a string que subs­ti­tuirá a definida no primeiro parâmetro. O terceiro es­pe­ci­fica em qual string a subs­ti­tui­ção será aplicada.

string <- "Hello World"
print(gsub("World", "User", string))
R

Em vez de falar oi para o mundo todo, o código acima apresenta um texto en­de­re­çado a alguém es­pe­cí­fico: o usuário (Hello User).

nchar()

Uma das funções mais im­por­tan­tes que podem ser aplicadas a strings em R é nchar(), que informa o com­pri­mento da string em questão.

string <- "Hello World"
print(nchar(string))
R

Em um primeiro momento, o comando em R length() pode ser confuso. No entanto, nessa linguagem de pro­gra­ma­ção, a função length() é usada para de­ter­mi­nar o número de elementos em um objeto, e não o número de ca­rac­te­res na string. Para descobrir o com­pri­mento de uma string em R, use a função nchar().

Dica

Publique os códigos em R pro­gra­ma­dos por você no Webspace da IONOS, que oferece um ano de domínio grátis e espaço su­fi­ci­ente para todos os seus projetos.

Ca­rac­te­res de controle e sequên­cias de escape

Use ca­rac­te­res de controle para definir a for­ma­ta­ção do texto de uma string em R — ca­rac­te­res de controle são sequên­cias de escape pre­de­fi­ni­das que podem ser usadas para formatar os textos a serem exibidos. Eles permitem, por exemplo, a de­ter­mi­na­ção de quebras de linha e ta­bu­la­ções.

Ca­rac­te­res especiais, como aspas, que nor­mal­mente seriam in­ter­pre­ta­dos como parte da sintaxe de uma string em R, podem ser exibidos por strings usando-se uma sequência de escape. Na pro­gra­ma­ção em R, você deve iniciar sequên­cias de escape com uma con­tra­barra. Conheça as sequên­cias mais im­por­tan­tes:

  • \n: Nova linha/quebra de linha
  • \t: Tabulador
  • \\: Con­tra­barra
  • \": Aspas duplas
  • \': Aspas simples
Ir para o menu principal