|
Material desenvolvido para os
usuários do
Instituto de Ciências Matemáticas e de Computação, da Universidade
de São Paulo em São Carlos, SP
Autora: Maria Alice Soares de Castro
ATENÇÃO: Este material não pode ser comercializado.
Este trabalho
não tem fins lucrativos, nem está relacionado a provedores de acesso ou sites comerciais.
|
:: Capa
» HTML Básico
|
|
Caracteres
especiais
HTML permite que caracteres especiais sejam representados por seqüências de escape, indicadas por três partes: um & inicial, um número ou cadeia de caracteres correspondente ao caracter desejado, e um ; final.
Quatro caracteres ASCII - <, >, e & têm significados especiais em HTML, e são usados dentro de documentos seguindo a correspondência:
|
Entidade |
Caracter |
< | < |
> | > |
& | & |
Outras sequências de escape suportam caracteres ISO Latin1. Aqui está
uma tabela com os caracteres mais utilizados em Português:
|
Entidade |
Caracter |
á | á |
â | â |
à | à |
ã | ã |
ç | ç |
é | é |
ê | ê |
í | í |
ó | ó |
ô | ô |
õ | õ |
ú | ú |
ü | ü |
|
|
Entidade |
Caracter |
Á | Á |
 |  |
À | À |
à | à |
Ç | Ç |
É | É |
Ê | Ê |
Í | Í |
Ó | Ó |
Ô | Ô |
Õ | Õ |
Ú | Ú |
Ü | Ü |
|
Como vemos, as sequências de escape são sensíveis à caixa.
Os editores de HTML fazem essa tradução automaticamente.
Alguns editores, no entanto, mantêm a
acentuação, sem usar as entidades de formatação. Quando isso acontece,
deve-se inserir uma indicação do esquema de codificação ISO Latin1, escrevendo:
<HTML>
<HEAD>
<TITLE>...</TITLE>
<META HTTP-EQUIV="Content-Type"
CONTENT="text/html; charset=ISO-8859-1">
</HEAD>
...
Existem alguns símbolos que vêm sendo incorporados ao conjunto de caracteres reconhecidos em HTML. Por exemplo, ©, que é o símbolo ©, ® para ®, e § para §.
Também se pode usar seqüências com códigos ASCII, por exemplo:
¿Qué pasa, señor?
¿Qué pasa, señor?
|
Introdução
à Linguagem HTML O
documento básico e seus compontentes
Formatação de textos Blocos de texto Frases Caracteres Especiais Cores e Fontes Blink Marquee
Ligações (uso de links)
Inserção de imagens
|
|
| «Por que usar essas formatações?»
Por causa de um problema técnico relativo à transmissão dos
caracteres especiais de várias línguas. Chama-se conjunto de caracteres uma representação digital de texto. O conjunto de representação amplamente utilizado é o ASCII. O ASCII padrão tem 7 bits, porém são usadas
versões particulares desse padrão - o ASCII americano, ASCII português, etc., que utilizam
8 bits. Se geramos um texto em ASCII de 8 bits e, na transmissão, esse texto é tratado por um sistema que “compreende” apenas o ASCII de 7 bits, os caracteres especiais serão transformados em caracteres diferentes, pela perda do oitavo
bit. Os usuários da Internet já devem ter sofrido experiência semelhante com mensagens de e-mail,
que chegam com caracteres estranhos, ou páginas da Web
com textos em japonês ou russo. |
|
|
|