Caracteres de codificação em código C ++

Computadores e Software / Programação / C ++

Tudo no computador é representado por um padrão de uns e zeros - variações de tensão que são interpretados como números. Assim, o padrão de bits 0000 0001 é o número 1 quando interpretado como um inteiro. No entanto, este mesmo padrão de bits significa algo completamente diferente quando interpretado como uma instrução pelo processador.

Por isso, deve vir como nenhuma surpresa que o computador codifica os caracteres do alfabeto, atribuindo a cada um número.

Considere o caractere 'A'. Você poderia atribuir-lhe qualquer valor que você quiser, desde que todos estamos de acordo sobre o valor. Por exemplo, você pode atribuir um valor de 1 para 'A', se você quisesse. Logicamente, você pode, em seguida, atribuir o valor 2 a 'B', 3 a 'C', e assim por diante.

Neste esquema, 'Z' iria receber o valor 26. Você pode, em seguida, começar de novo, atribuindo o valor de 27 a 'a', 28 para 'b', até 52 de 'z'. Isso ainda deixa os dígitos '0' a '9' plus todos os símbolos especiais como espaço, ponto, vírgula, barra, ponto e vírgula, e os personagens engraçadas que você vê quando você pressiona as teclas numéricas enquanto pressiona SHIFT para baixo.

Acrescente a isso o caracteres não imprimíveis, como guia e nova linha. Quando tudo estiver dito e feito, você pode codificar todo o teclado Inglês usando números entre 1 e 127.

Por volta de 1963, houve um acordo geral sobre como os caracteres devem ser codificados em Inglês. O ASCII (American Standard Codificação para Intercâmbio de Informações) codificação de caracteres mostrado na foi adotado praticamente universalmente exceto por uma empresa.

IBM publicou o seu próprio padrão em 1963 também. Os dois padrões de codificação duked-lo por cerca de dez anos, mas no início da década de 1970 - quando C e C ++ foram sendo criados - ASCII tinha praticamente ganhou a batalha. o carbonizar tipo foi criado com codificação de caracteres ASCII em mente.

O conjunto de caracteres ASCII
Valor	carbonizar	Valor	carbonizar
0	NULO	64	@
1	Iniciar da posição	65	UMA
2	Início do texto	66	B
3	Fim de texto	67	C
4	Fim da Transmissão	68	D
5	Inquérito	69	E
6	Reconhecer	70	F
7	Sino	71	G
8	retrocesso	72	H
9	Aba	73	Eu
10	Nova linha	74	J
11	Tab Vertical	75	K
12	New Form Feed Page-	76	eu
13	Retorno de carro	77	M
14	deslocar fora	78	N
15	mudança na	79	O
16	Data Link Fuga	80	P
17	Controle de dispositivo 1	81	Q
18	Controle de dispositivo 2	82	R
19	Controle de dispositivo 3	83	S
20	Device Control 4	84	T
21	Reconhecimento negativa	85	você
22	Espera Synchronous	86	V
23	Fim da Transmissão	87	W
24	Cancelar	88	x
25	End of Médio	89	Y
26	Substituto	90	Z
27	Escapar	91	[
28	ficheiro separador	92
29	grupo Separator	93	]
30	Grave Separator	94	^
31	Unit Separator	95	_
32	Espaço	96	`
33	!	97	uma
34	# 147-	98	b
35	#	99	c
36	$	100	d
37	%	101	e
38		102	f
39	'	103	g
40	(	104	h
41	)	105	Eu
42	*	106	j
43	+	107	k
44	,	108	eu
45	=	109	m
46	.	110	n
47	/	111	o
48	0	112	p
49	1	113	q
50	2	114	r
51	3	115	s
52	4	116	t
53	5	117	você
54	6	118	v
55	7	119	W
56	8	120	x
57	9	121	y
58	:	122	z
59	-	123
60	lt;	124
62	>	126	~
63	?	127	DEL

A primeira coisa que você vai notar é que os primeiros 32 caracteres são o # 147 impublicável # 148- caracteres. Isso não significa que esses personagens são tão impertinente que o censor não vai permitir que eles sejam impressos - isso significa que eles não aparecem como símbolos visíveis quando impresso na impressora (ou no console, para que o assunto). Muitos destes personagens não são mais utilizados ou utilizados apenas em caminhos obscuros.

Por exemplo, o caráter 25 # 147-End of Medium # 148- provavelmente foi impresso como o último caractere antes do final de um rolo de fita magnética. Isso foi um grande negócio em 1963, mas hoje em dia. . . não tanto, por isso o uso do personagem é limitado.

Os caracteres começando com 32 são todos imprimível com a excepção do último, 127, que é o personagem Delete.

Caracteres de codificação em código C ++

Semelhante

menu