Contador de Bytes — Calculadora de bytes UTF-8, UTF-16 e UTF-32

Precisa do tamanho exato em bytes de uma string? Cole qualquer texto abaixo para ver o comprimento em bytes UTF-8, UTF-16 e UTF-32 junto com caracteres e pontos de código.

Contador de bytes

Calculadora de bytes UTF-8

Digite o texto
0
Bytes UTF-8
0
Bytes UTF-16
0
Bytes UTF-32
0
Caracteres
0
Pontos de código

O UTF-8 usa de 1 a 4 bytes por caractere: ASCII 1 byte, latim acentuado 2, a maioria do CJK 3 e os emojis 4.

Quantos bytes tem o seu texto?

Caracteres e bytes não são a mesma coisa. O tamanho em bytes de uma string depende da codificação: o UTF-8 usa um byte para ASCII e até quatro para emojis, o UTF-16 usa dois ou quatro, e o UTF-32 usa sempre quatro por ponto de código. Cole o seu texto acima e esta ferramenta mostra os três ao mesmo tempo, para saber exatamente quanto espaço uma string ocupa.

Por que o tamanho em bytes importa

Os limites de bytes aparecem em todo o lado: tamanhos de colunas de base de dados (VARCHAR é muitas vezes medido em bytes), cabeçalhos HTTP e cookies, orçamentos de JSON, segmentos SMS, códigos QR e limites de campos de API. Uma string de 20 caracteres pode ter 20 ou 80 bytes consoante o alfabeto, por isso contar apenas caracteres pode ultrapassar um limite sem aviso. O UTF-8 é o padrão na web, no JSON e na maioria das bases de dados.

Caracteres, pontos de código e bytes

Esta ferramenta separa três contagens diferentes. Os caracteres são grupos de grafemas — o que o leitor perceciona como um símbolo, incluindo emojis compostos por vários pontos de código. Os pontos de código são valores escalares Unicode individuais. Os bytes são o tamanho de armazenamento codificado. Um emoji como 👍 é um caractere, um ponto de código e quatro bytes UTF-8; um emoji de bandeira é um caractere, mas dois pontos de código e oito bytes UTF-8.

Privado e instantâneo

Tudo é calculado no seu navegador com o TextEncoder padrão, por isso as contagens correspondem exatamente ao que o seu servidor ou base de dados vai guardar. Nada do que colar é enviado, o que o torna seguro para tokens, chaves e outras strings sensíveis. Edite o texto e cada número atualiza-se ao vivo.

Perguntas frequentes

Quantos bytes tem um caractere em UTF-8?

Entre 1 e 4. Letras e dígitos ASCII têm 1 byte, latim acentuado e grego/cirílico 2, a maioria dos caracteres chineses/japoneses/coreanos 3, e os emojis e símbolos raros 4.

Qual é a diferença entre caracteres, pontos de código e bytes?

Um caractere (grafema) é o que vê como um símbolo; um ponto de código é um valor escalar Unicode; os bytes são o tamanho codificado. Um único emoji pode ser 1 caractere, 1 ponto de código e 4 bytes UTF-8 — e emojis compostos por vários pontos de código usam ainda mais.

Que codificação devo contar para uma base de dados?

Normalmente UTF-8, o padrão da web, do JSON e da maioria das bases de dados modernas. Verifique se o comprimento da coluna é definido em bytes ou caracteres — caracteres multibyte UTF-8 podem exceder um limite baseado em bytes.

O meu texto é enviado para um servidor?

Não. A contagem de bytes é feita inteiramente no seu navegador com o TextEncoder padrão, por isso é segura para chaves de API, tokens e outras strings sensíveis.

Última atualização: 14 de junho de 2026

Pronto para ver como sua publicação realmente aparece?

Cole seu rascunho no editor do PostTruncate e veja instantaneamente pré-visualizações ao vivo para LinkedIn, X, Instagram, Facebook, Threads e TikTok — com linhas de corte, divisões de thread e avisos de limite atualizando enquanto você digita. Gratuito, instantâneo e nada sai do seu navegador.

Comece a escrever — é gratuito