banco de dúvidaslistacontatooutros materiais


Material desenvolvido para os usuários do Instituto de Ciências Matemáticas e de Computação, da Universidade de São Paulo em São Carlos, SP

Autora: Maria Alice Soares de Castro

ATENÇÃO:
Este material não pode ser comercializado.

Este trabalho não tem fins lucrativos, nem está relacionado a provedores de acesso ou sites comerciais.

 

Caracteres especiais

HTML permite que caracteres especiais sejam representados por seqüências de escape, indicadas por três partes: um & inicial, um número ou cadeia de caracteres correspondente ao caracter desejado, e um ; final.

Quatro caracteres ASCII - <, >, e & têm significados especiais em HTML, e são usados dentro de documentos seguindo a correspondência:

Entidade

Caracter

&lt; <
&gt; >
&amp; &

Outras sequências de escape suportam caracteres ISO Latin1. Aqui está uma tabela com os caracteres mais utilizados em Português:

Entidade

Caracter

&aacute; á
&acirc; â
&agrave; à
&atilde; ã
&ccedil; ç
&eacute; é
&ecirc; ê
&iacute; í
&oacute; ó
&ocirc; ô
&otilde; õ
&uacute; ú
&uuml; ü

Entidade

Caracter

&Aacute; Á
&Acirc; Â
&Agrave; À
&Atilde; Ã
&Ccedil; Ç
&Eacute; É
&Ecirc; Ê
&Iacute; Í
&Oacute; Ó
&Ocirc; Ô
&Otilde; Õ
&Uacute; Ú
&Uuml; Ü

Como vemos, as sequências de escape são sensíveis à caixa. Os editores de HTML fazem essa tradução automaticamente.

Alguns editores, no entanto, mantêm a acentuação, sem usar as entidades de formatação. Quando isso acontece, deve-se inserir uma indicação do esquema de codificação ISO Latin1, escrevendo:

<HTML>
<HEAD>
<TITLE>...</TITLE>
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html; charset=ISO-8859-1">
</HEAD>
...

Existem alguns símbolos que vêm sendo incorporados ao conjunto de caracteres reconhecidos em HTML. Por exemplo, &copy;, que é o símbolo ©, &reg; para ®, e &sect; para §.

Também se pode usar seqüências com códigos ASCII, por exemplo:

&#191;Qué pasa, señor?

¿Qué pasa, señor?

 

«Por que usar essas formatações?»

Por causa de um problema técnico relativo à transmissão dos caracteres especiais de várias línguas.
Chama-se conjunto de caracteres uma representação digital de texto. O conjunto de representação amplamente utilizado é o ASCII. O ASCII padrão tem 7 bits, porém são usadas versões particulares desse padrão - o ASCII americano, ASCII português, etc., que utilizam 8 bits.
Se geramos um texto em ASCII de 8 bits e, na transmissão, esse texto é tratado por um sistema que “compreende” apenas o ASCII de 7 bits, os caracteres especiais serão transformados em caracteres diferentes, pela perda do oitavo bit.
Os usuários da Internet já devem ter sofrido experiência semelhante com mensagens de e-mail, que chegam com caracteres estranhos, ou páginas da Web com textos em japonês ou russo.

 

©1995-2003 - URL: http://www.icmc.usp.br/ensino/material/html/especiais.html