Byte-tæller — UTF-8-, UTF-16- og UTF-32-byte-beregner

Har du brug for den nøjagtige byte-størrelse af en streng? Indsæt en hvilken som helst tekst nedenfor for at se længden i UTF-8-, UTF-16- og UTF-32-bytes sammen med tegn og kodepunkter.

Byte-tæller

UTF-8-byte-beregner

Indtast tekst
0
UTF-8-bytes
0
UTF-16-bytes
0
UTF-32-bytes
0
Tegn
0
Kodepunkter

UTF-8 bruger 1–4 bytes pr. tegn: ASCII 1 byte, accentueret latin 2, de fleste CJK 3 og emojis 4.

Hvor mange bytes er din tekst?

Tegn og bytes er ikke det samme. En strengs byte-størrelse afhænger af kodningen: UTF-8 bruger én byte til ASCII og op til fire til emojis, UTF-16 to eller fire, og UTF-32 altid fire pr. kodepunkt. Indsæt din tekst ovenfor, og dette værktøj viser alle tre på én gang, så du ved præcis, hvor meget plads en streng fylder.

Hvorfor byte-størrelse betyder noget

Byte-grænser dukker op overalt: databasekolonner (VARCHAR måles ofte i bytes), HTTP-headere og cookies, JSON-budgetter, SMS-segmenter, QR-koder og API-feltgrænser. En streng på 20 tegn kan være 20 eller 80 bytes afhængigt af skriftsystemet, så det at tælle tegn alene kan overskride en grænse uden varsel. UTF-8 er standarden på nettet, i JSON og i de fleste databaser.

Tegn, kodepunkter og bytes

Dette værktøj adskiller tre forskellige tællinger. Tegn er grafemklynger — det, læseren opfatter som ét symbol, inklusive emojis sammensat af flere kodepunkter. Kodepunkter er enkelte Unicode-skalarværdier. Bytes er den kodede lagringsstørrelse. En emoji som 👍 er ét tegn, ét kodepunkt og fire UTF-8-bytes; en flag-emoji er ét tegn, men to kodepunkter og otte UTF-8-bytes.

Privat og øjeblikkeligt

Alt beregnes i din browser med den standardiserede TextEncoder, så tællingerne svarer nøjagtigt til det, din server eller database gemmer. Intet af det, du indsætter, uploades, hvilket gør det sikkert til tokens, nøgler og andre følsomme strenge. Rediger teksten, og hvert tal opdateres live.

Ofte stillede spørgsmål

Hvor mange bytes er ét tegn i UTF-8?

Mellem 1 og 4. ASCII-bogstaver og -tal er 1 byte, accentueret latin samt græsk/kyrillisk 2, de fleste kinesiske/japanske/koreanske tegn 3, og emojis og sjældnere symboler 4.

Hvad er forskellen på tegn, kodepunkter og bytes?

Et tegn (grafem) er det, du ser som ét symbol; et kodepunkt er én Unicode-skalarværdi; bytes er den kodede størrelse. En enkelt emoji kan være 1 tegn, 1 kodepunkt og 4 UTF-8-bytes — og emojis sammensat af flere kodepunkter bruger endnu mere.

Hvilken kodning skal jeg tælle til en database?

Som regel UTF-8, standarden for nettet, JSON og de fleste moderne databaser. Tjek, om din kolonnelængde er defineret i bytes eller tegn — UTF-8-multibyte-tegn kan overskride en byte-baseret grænse.

Bliver min tekst sendt til en server?

Nej. Byte-tællingen kører helt i din browser med den standardiserede TextEncoder, så den er sikker til API-nøgler, tokens og andre følsomme strenge.

Sidst opdateret: 14. juni 2026

Klar til at se, hvordan dit opslag faktisk ser ud?

Indsæt dit udkast i PostTruncate-editoren og se øjeblikkeligt live-forhåndsvisninger for LinkedIn, X, Instagram, Facebook, Threads og TikTok — med foldlinjer, tråd-opdeling og grænseadvarsler, der opdateres mens du skriver. Gratis, øjeblikkeligt og intet forlader din browser.

Begynd at skrive — det er gratis