Strona główna
Spis poleceń HTML | Wstęp | Etykieta webmastera | HTML dla bardzo początkujących | Struktura dokumentu | Czcionki | Elementy blokowe | Odsyłacze | Wykazy | Grafika i multimedia | Tabele | Style | Ramki | Pływające ramki | Formularze | Znaki specjalne | Kolory | Ankieta
Księga gości | Wprowadzenie do JavaScript | Przydatne skrypty | Response-O-Matic | TopNet Mailer | Liczniki wizyt | Kilka słów o narzędziach | Leksykon webmastera | Wprowadzenie do FrontPage Express | Jak publikować w języku Esperanto? | Tworzenie stron z ActiveX | Tworzenie stron z HTML Help Java Applet | Narzędzia ICQ | Zasoby webmasterskie

Struktura dokumentu

Czym jest dokument HTML? | Dlaczego stosujemy edytory HTML? | Podstawowe elementy dokumentu | Więcej szczegółów o HEAD | Więcej szczegółów o BODY | Kilka uwag o wlewaniu tekstu

[hand]Czym jest dokument HTML?

Być może wiele osób sądzi, że strona w języku HTML jest jakimś tajemnym dokumentem, o specjalnym formacie, do tworzenia której potrzebne są specjalistyczne narzędzia i daleko idąca wiedza. Nic z tych rzeczy! Do utworzenia takiej strony nie jest potrzebne nic więcej niż... zwykły edytor tekstów. Może to być, przynajmniej teoretycznie, najprostszy edytor, jak Notatnik, który potrafi zapisywać dokument w postaci tekstowej.

W dokumentach powinniśmy stosować standard kodowania polskich liter ISO-8859-2.
Po pierwsze, jest to międzynarodowy standard, przyjęty także w charakterze Polskiej Normy.
Po drugie, jest to standard bardziej uniwersalny, gdyż jest dostępny w wielu systemach operacyjnych.
Należy zatem unikać używania innych standardów, np. Windows-1250. W tej chwili praktycznie wszystkie systemy operacyjne są obsługiwane przez przeglądarki potrafiące rozpoznawać deklarację strony kodowej, umieszczanej w ramach części nagłówkowej strony (HEAD). Ma ona w tym wypadku następującą postać:

<HEAD>
<meta http-equiv="content-type" content="text/html; charset=iso-8859-2">
</HEAD>

Kosztem stosowania standardu ISO-8859-2 jest błędne wyświetlanie w starszych przeglądarkach (Internet Explorer 3) kilku polskich znaków w niektórych elementach strony - skryptach Javy, belce tytułowej, wierszu statusu, alternatywnych opisach grafik, formularzach. Jeśli będzie to razić poczucie estetyki autora, może zrezygnować w nich ze stosowania polskich liter. Pamiętajmy jednak, że IE3 ma już tylko kilkuprocentowy udział w rynku, więc problem ma charakter coraz bardziej marginalny.

Stosowanie standardu kodowania Windows-1250 nie jest zabronione, ale nie jest również zalecane. Gdyby webmaster z jakichś powodów chciał stosować ten standard, powinien bezwględnie umieścić w dokumencie deklarację użytej strony kodowej:

<HEAD>
<meta http-equiv="content-type" content="text/html; charset=windows-1250">
</HEAD>


Uwaga praktyczna:

Aby wygodnie redagować dokumenty w standardzie kodowania ISO-8859-2, należy się zaopatrzyć w czcionki w tym standardzie. Są one dostępne na polskiej stronie "ogonkowej", pod adresem http://www.agh.edu.pl/ogonki/pl.html. Użytkownikom edytorów dla Windows polecam darmowe czcionki ekranowe PolskieStrony i PolskieStrony2, dostępne w serwisie Polska Strona Windowsowa. Użytkownikom edytora HomeSite 2.5 lub nowszego należy zalecać używanie czcionki PolskieStrony2. Należy również używać nakładki klawiaturowej, która pozwala zdefiniować klawiaturę ISO, np. w pakietach Mako lub Zecer. Pakiet Zecer 2.1 zawiera nakładkę klawiaturową Polkeyb, autorstwa Andrzeja Górbiela. Nakładka pozwala zdefiniować klawiatury w trybie graficznym, choć możliwe jest to za pomocą ręcznego wpisu do pliku WIN.INI.

Dla ułatwienia podaję treść wpisu. Wystarczy go skopiować do schowka, wstawić do sekcji [PolKeyb] w WIN.NI, zapisać plik na dysku i ponownie uruchomić Windows. Fragment WIN.INI powinien wyglądać następująco:

[PolKeyb]
settings=0 2 10 0 1 10 0

name0=ISO-8859-2
keys0=ACELNOSXZ
lower0=177,230,234,179,241,243,182,188,191
upper0=161,198,202,163,209,211,166,172,175

Aby tekst w edytorze HTML był poprawnie wyświetlany, należy wybrać czcionkę ISO.

Wygodną, darmową klawiaturę ISO można znaleźć w serwisie Polska Strona Windowsowa

A stąd możesz pobrać za darmo Polkeyb 2.4 (35 KB)

Uwaga: powyższe uwagi nie dotyczą czołowych polskich edytorów, jak Pajączek 2000, Tiger czy WebPager Xpress, które automatycznie kodują znaki w wybranym standardzie kodowania. W przypadku tego ostatniego edytora potrzebna jest jedynie czcionka ekranowa ISO.


Dokument HTML jest więc najzwyczajniejszym plikiem tekstowym, który zawiera jednak pewne osobliwe znaczniki, zwane z angielska "tagami". "Tagi", których jest blisko setka, stanowią wraz z parametrami język HTML. Same składają się z nawiasów kątowych, między którymi znajdują się ściśle określone litery. Na przykład <H1> jest otwierającym znacznikiem tytułu pierwszego stopnia. Większość znaczników składa się z części otwierającej oraz zamykającej, która zawiera dodatkowo tzw. ukośnik (slash).

Gdybyśmy chcieli wprowadzić tytuł drugiego stopnia, powinniśmy napisać:
<H2>Treść tytułu drugiego stopnia</H2>, co w efekcie powinno dać wynik:

Treść tytułu drugiego stopnia

W podobny sposób możemy wprowadzić do dokumentu poziomą linię, posługując się pojedynczym znacznikiem <HR>, dzięki czemu uzyskamy na ekranie przeglądarki


Doszliśmy w tym miejscu do związku dokumentu HTML z przeglądarką World Wide Web. Przeglądarka jest wyspecjalizowanym programem, który interpretuje znaczniki i "przetwarza" je na właściwą postać graficzną. Do tej pory zaprojektowano już wiele przeglądarek, różniących się zaawansowaniem technicznym, a najdoskonalszymi z nich są obecnie Netscape Communicator (wersja 6), wyprodukowany przez amerykańską firmę Netscape Communications, Internet Explorer (wersja 5.5), firmy Microsoft, oraz Opera (wersja 5), firmy Opera Software.

Wróćmy jednak do HTML.

Do zbudowaniu dokumentu HTML nie potrzeba więc niczego więcej jak znajomości języka i prostego edytora tekstów (ale zalecam stosowanie specjalizowanych edytorów!). Powszechnie przyjętym standardem jest opublikowany w grudniu 1997 roku HTML 4.0. Obszerny opis najnowszej specyfikacji, czyli HTML 4.01 Specification (24 grudnia 1999), znajduje się na internetowej stronie http://www.w3.org/TR/html4/ - można tam również pobrać spakowane archiwum.

Ważna uwaga: formalnie zalecane jest stosowanie wyłącznie języka wchodzącego w skład oficjalnej specyfikacji HTML. Jest to oczywiście zalecenie, a nie bezwzględny przymus stosowania, którego ignorowanie pociąga za sobą jakiekolwiek sankcje, np. usunięcie witryny z Sieci - przynajmniej w tej chwili. Decyzję o przestrzeganiu lub wykraczaniu poza standard powinien podjąć SAM AUTOR serwisu, który przyjmuje tym samym płynące z tego tytułu konsekwencje. Skutkiem nieprzestrzegania specyfikacji może być to, że niektóre przeglądarki będą wadliwie interpretować przygotowane strony. Pamiętajmy także, że nawet czołowe przeglądarki nie interpretują w pełni elementów HTML 4.


[hand]Dlaczego stosujemy edytory HTML?

Skoro tworzenie dokumentu jest technicznie tak proste, dlaczego pojawiło się na świecie tak wiele edytorów HTML? Odpowiedź jest także prosta. Zamiast pracowicie wpisywać ręcznie znaczniki, wystarczy kliknąć na odpowiednim przycisku lub nacisnąć jakiś skrót klawiszowy, aby wprowadzić odpowiedni znacznik. Bardziej zaawansowane produkty wspomagają tworzenie wyspecjalizowanych elementów, jak tabele, odsyłacze, ramki czy formularze. I na tym właśnie polega istota ich pracy. Nie pozostawiają użytkownika samemu sobie, lecz intensywnie wspomagają jego pracę, znacznie ją przyspieszając i ułatwiając.

W Internecie, np. w grupach dyskusyjnych, pojawiają się często opinie, że "prawdziwy webmaster" nie używa niczego innego niż najprostszy notatnik. Należy stanowczo i zdecydowanie odrzucić takie stanowisko - praca bez wspomagania ze strony specjalizowanego edytora HTML jest oczywiście możliwa, ale jest znacznie bardziej czasochłonna, a przede wszystkim naraża na popełnianie błędów składniowych. Tego rodzaju opinie wprowadzają w błąd niedoświadczonych webmasterów, którzy przejęci nonszalancją "uczonych w piśmie" chcą postępować w podobny sposób. Prawdziwy webmaster to ten, kto tworzy poprawny kod, a nie ten, kto używa najprostszych narzędzi.


[hand]Podstawowe elementy dokumentu

Dokument HTML, aby odpowiadał przyjętemu standardowi, powinien zawierać co najmniej trzy elementy. Choć często spotyka się w Internecie dokumenty nie zawierające wszystkich poleceń, należy unikać tej maniery.

Wcześniej warto jeszcze powiedzieć, że często stosuje się w dokumentach WWW specjalny prolog, który identyfikuje poziom używanego języka HTML. Jest on wstawiany jako pierwszy element dokumentu, JESZCZE PRZED otwarciem szkieletu strony, czyli <HTML>. Prolog jest m.in. wykorzystywany jako oznaczenie poziomu w procesie weryfikacji poprawności składni za pomocą tzw. parserów. Specyfikacja HTML 4 przewiduje trzy wersje prologu.

Jeśli dokument jest zgodny ze specyfikacją HTML 4.0.1, możemy stosować prolog:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN">

Prolog ten odpowiada wersji STRICT definicji typu dokumentu (DTD), a więc wykluczającej wszelkie elementy prezentacyjne, które specyfikacja HTML 4 uznaje za schyłkowe (deprecated). Wersja jest jest więc okrojonym HTML 4, przedkładającym strukturę nad prezentację.

Niektórzy autorzy stron dodają jeszcze sieciowy adres tej wersji DTD (ma on służyć do ewentualnego pobrania definicji przez przeglądarkę), choć nie jest to bezwzględnie konieczne - nawet specyfikacja HTML nie podaje tego adresu.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

Częściej stosowaną wersją prologu jest tzw. wersja przejściowa ("luźna"):

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

Prolog ten deklaruje dokument jako zawierający wszelkie możliwe elementy i atrybuty HTML, łącznie ze schyłkowymi. Specyfikacja HTML sama posługuje się właśnie tym prologiem.

Wersja z adresem sieciowym DTD ma postać:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

Szerszą odmianą Transitional jest prolog dla strony zawierającej ramki (jest to po prostu Transitional uzupełniona o ramki) :

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN">

I jego wersja z adresem:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">

Jeśli dokument jest zgodny z wcześniejszą specyfikacją HTML 3.2, powinniśmy stosować prolog:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">

lub

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">

Parsery przyjmują takie deklaracje jako podstawę badania poprawności składniowej. Najlepiej skorzystać z oficjalnego parsera World Wide Web Consortium, opartego na specyfikacji HTML 4.0.:

W3C HTML Validation Service

Warto w tym miejscu powiedzieć kilka słów o programach, które weryfikują składnię offline, czyli na komputerze użytkownika. Dobrymi narzędziami, aczkolwiek w chwili obecnej nie dysponującymi wbudowanym parserem SGML, są HTML Powertools, firmy Opposite Software, a także CSE 3310 HTML Validator dla Windows 95, firmy Alsoft Internet Solutions. Są to dobre korektory poprawności składniowej, wychwytujące wiele błędów, aczkolwiek nie traktujące tak rygorystycznie standardu HTML. Osoba, której zależy na absolutnej zgodności ze standardem, powinna je traktować tylko jako bardzo dobre narzędzie pomocnicze. Oba programy są płatne, ale Alsoft Internet Solutions oferuje też darmową, uproszczoną wersję Lite, która pomaga usunąć wiele "głupich" błędów na stronie - sam chętnie korzystam z tego programu i polecam go wszystkim webmasterom.

Wróćmy do szkieletu strony.

<HTML> </HTML>

Jest to otwierający i zamykający znacznik dokumentu, a między nimi jest umieszczana cała treść. Znacznik nie jest bezpośrednio widoczny w przeglądarce.

<HEAD> </HEAD>

Znacznik jest umieszczany wewnątrz znaczników HTML i sam zawiera podstawowe informacje o dokumencie, w pierwszym rzędzie tytuł strony. W ramach tego znacznika jest umieszczana tzw. część nagłówkowa.

<BODY> </BODY>

Jest to znacznik umieszczany wewnątrz znaczników HTML, za znacznikami HEAD. Zawiera konkretną treść dokumentu.

W praktyce wygląda to następująco:


<HTML>
<HEAD>

Informacje nagłówkowe o dokumencie, łącznie z tytułem

</HEAD>
<BODY>

Treść dokumentu - śródtytuły, tekst, grafika, odsyłacze itp.

</BODY>
</HTML>


[hand]Więcej szczegółów o HEAD

Definiując <HEAD> możemy wstawić kilka dalszych parametrów, które uzupełniają informacje o stronie.

[zielona kropka]<TITLE></TITLE>

Najważniejszym elementem (koniecznie go używaj!) jest tytuł strony, który ukazuje się w belce tytułowej przeglądarki. Zaleca się zwykle nieprzekraczanie 40 znaków. Tytułu nie należy mylić z pierwszym nagłówkiem strony, aczkolwiek oba te elementy mogą mieć oczywiście tę samą treść. Załączony fragment ekranu pokazuje w belce treść Netscape - (Kurs języka HTML), gdyż w dokumencie znalazła się definicja <TITLE>Kurs języka HTML</TITLE>.

[tytuł w belce]

Ważna uwaga: Nie używaj w tytułach samych WIELKICH LITER, gdyż wiele wyszukiwarek zignoruje stronę. Nie wpisuj także w ramach TITLE adresów internetowych, gdyż skutek będzie taki sam. Warto także pamiętać, że indeksery nadają temu znacznikowi wysoki priorytet, a więc warto w nim podać istotne informacje, np. nie "Moja strona domowa", lecz raczej "Psy, koty i inne zwierzaki domowe".

[zielona kropka]<META>

Jest to opcjonalne polecenie, które bardziej szczegółowo informuje o zawartości dokumentu, np. dla celów katalogowych czy indeksów, wykorzystywanych przez odpowiednie programy, np. wyszukiwarki sieciowe. Zawiera ono trzy atrybuty: HTTP-EQUIV, NAME i CONTENT w kombinacji pierwszy z trzecim lub drugi z trzecim. HTTP-EQUIV definiuje zmienne systemowe, natomiast NAME - zmienne użytkownika.

Chociaż META jest poleceniem opcjonalnym, nie wymaganym dla poprawności dokumentu, używanie go jest zalecane (podkreślam to pogrubieniem i czerwonym kolorem!), gdyż usprawnia funkcjonowanie witryny w Sieci. META nie jest zbiorem nikomu niepotrzebnych zaklęć, lecz użytecznym instrumentem współpracującym z przeglądarkami internetowymi i sieciowymi wyszukiwarkami. Wstawienie tych "zaklęć" jest banalną czynnością, a korzyści są niezaprzeczalne. Pamiętaj, że trzeba opisać każdy dokument z osobna, aczkolwiek w wielu sytuacjach wystarczy po prostu skopiować dane META z jednego dokumentu do pozostałych.

Zwróćmy uwagę na kilka poleceń, które można umieścić w <META>. Polecamy w szczególności: strona kodowa, opis strony, wyrazy kluczowe, autor strony.

<META HTTP-EQUIV="content-type" CONTENT="text/html; charset=iso-8859-2">

Polecenie jest deklaracją strony kodowej dokumentu. Inna postać to charset=windows-1250. Nowe przeglądarki (Navigator/Communicator, Internet Explorer) potrafią się automatycznie przestawić na właściwą stronę kodową, zgodnie z podaną deklaracją. Nie jest potrzebna interwencja użytkownika, który nie musi nawet wiedzieć, z jakim standardem kodowania polskich znaków ma do czynienia. Polecenie to jest bezwzględnie zalecane przy tworzeniu stron WWW. Jego brak jest, niestety, powszechnym błędem na stronach HTML-owych nowicjuszy.

Uwaga: aby strona była poprawnie wyświetlana w danym standardzie, np. ISO-8859-2, nie wystarczy podać jedynie tę deklarację. Także i polskie litery muszą być zapisane w tym standardzie. To spotykany nierzadko błąd początkujących webmasterów, którzy uważają, że sam charset załatwia sprawę. Użytkownicy dobrego polskiego edytora (np. Pajączka) nie muszą się na szczęście o to martwić, gdyż edytor sam się troszczy o obie sprawy.


<META NAME ="Description" CONTENT="jakaś tam treść">

Polecenie to opisuje zawartość strony. Zalecam stosowanie go, gdyż dzięki niemu ułatwiamy pracę osobom korzystającym z wyszukiwarki. Przykładowo, gdy posłużymy się Infoseekiem, szukając np. stron poświęconym językowi Esperanto, łatwo dostrzeżemy funkcjonalność poleceń TITLE i Description. To, co umieściliśmy w ramach TITLE, zostanie wyświetlone jako tytuł znalezionej strony. Z kolei zawartość Description zostanie wyświetlona niżej, jako opis naszej strony. Gdybyśmy nie użyli Description, wyszukiwarka wyświetli kilka pierwszych wierszy naszego dokumentu, które mogą być zupełnie przypadkowe. Uważnie i świadomie zredagowana zawartość Description da natychmiast orientację co do zawartości strony. Może to być na przykład:

<META NAME ="Description" CONTENT="Esperanto: strona zawiera podstawowe informacje o języku Esperanto, odsyłacze do najważniejszych stron, podręcznik i słowniczek.">

Zaleca się nieprzekraczanie 150-200 znaków - w niektórych specjalistycznych serwisach spotyka się zalecenie "co najwyżej 20-25 wyrazów".


<META NAME="Keywords" CONTENT="jakieś wyrazy kluczowe">

Polecenie informuje o wyrazach kluczowych dokumentu, zwracając przykładową wartość Keywords: HTML, Lupus. Warto stosować wyrazy kluczowe, gdyż ułatwia to pracę sieciowym programom indeksująco-wyszukiwawczym i zwiększa szansę znalezienia strony przez innych użytkowników. To my właśnie decydujemy tutaj, jakie są istotne elementy strony. Jeśli nasza strona zawiera opis jakiegoś produktu, moglibyśmy podać wyrazy kluczowe "marmolada śliwkowa, przemysł, spółdzielnia Lepsze Jutro, żywność". Poszczególne wyrazy kluczowe są oddzielane przecinkami. Dla scharakteryzowania strony zazwyczaj wystarcza kilka, rzadziej kilkanaście wyrazów. Kilkadziesiąt to już absolutny wyjątek. Generalnie, nie powinno się przekraczać 1000 znaków.

Polecam pobranie 15-dniowej wersji testowej programu TagGen z serwisu TUCOWS i zapoznanie się z jego działaniem, a zwłaszcza z funkcją Meta tag analysis. To dobra szkoła dla webmastera dbającego o opisanie swojego serwisu.

Uwaga: nie powtarzaj wyrazów kluczowych, chcąc "podbić" swój ranking (np. sex, sex, sex), gdyż wiele wyszukiwarek może to potraktować jako spam i za karę wykluczyć stronę z indeksu. No i unikaj używania szczególnie popularnych wyrazów kluczowych, poszukiwanych przez internautów, jeśli strona w ogóle się z nimi nie wiąże. To postępowanie nieetyczne. Nie wolno zwabiać na swoje strony kłamliwymi informacjami.


<META HTTP-EQUIV="Content-Language" CONTENT="pl">

Polecenie informuje o języku strony. Niektóre przeglądarki korzystają z niego przy precyzowaniu zapytań. Dla języka angielskiego użyjemy en, dla amerykańskiego angielskiego en-us, dla niemieckiego de, dla francuskiego fr, dla rosyjskiego "ru" itd.


<META NAME="Author" CONTENT="imię i nazwisko">

Polecenie informuje o autorze strony.


<META NAME="Generator" CONTENT="nazwa edytora">

Polecenie informuje o użytym narzędziu do tworzenia stron HTML, np. Homesite, Pajączek, Tiger98.


<META HTTP-EQUIV="expires" CONTENT="data i czas">

Polecenie wskazuje przeglądarce, kiedy dokument traci "ważność" i trzeba go wczytać na nowo z Sieci. Data musi być podawana w formacie zdefiniowanym przez dokument RFC850.

Przykład:

<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Apr 2001 08:21:57 GMT">

Polecenie może być przydatne w przypadku długich dokumentów, których zawartość zmienia się w przewidzianych z góry momentach, jak np. dokumenty o oficjalnym charakterze.


<META HTTP-EQUIV="Pragma" CONTENT="no-cache">

Polecenie określa, czy strona ma być cache'owana na lokalnym dysku. Użycie no-cache zakazuje przeglądarce tej czynności i za każdym razem strona jest wczytywana z Sieci.


<META HTTP-EQUIV="Refresh" CONTENT="x">

Polecenie spowoduje regularne odświeżanie strony co x sekund. Może to mieć praktyczne zastosowanie w przypadku, gdy strona zawiera bardzo często aktualizowane informacje (wiele razy dziennie). Gdy użytkownik korzysta ze strony przez dłuższy czas, strona będzie się sama aktualizowała.

Uwaga: nie stosuj tego polecenia jako narzędzia do "podbijania" wartości swojego licznika wizyt. Goście Twojej strony prędko zrezygnują z wizyt, gdy w trakcie czytania strona będzie się nagle odświeżała. No, chyba że robisz rzeczywiste aktualizacje co pół godziny :-) ...


<META HTTP-EQUIV="Refresh" CONTENT="x; URL=http://.../strona.html">

Polecenie spowoduje automatyczne wczytanie nowej strony po x sekundach. W Internecie często spotyka się strony z informacją o zmianie adresu, gdy odsyłacz z innej strony jest już nieaktualny. Autor strony pozostawia pod starym adresem informację o zmianie, podając nowy adres, ale opatrując tę stronę zaprezentowanym poleceniem, które spowoduje automatyczne przejście pod właściwy adres po x sekundach. Tylko niektóre przeglądarki interpretują to polecenie.


<META HTTP-EQUIV="Creation-Date" CONTENT="Tue, 04 Dec 1993 21:29:02 GMT">

Polecenie informuje o dacie utworzenia dokumentu, zwracając wartość (np. sieciowemu indekserowi) Creation-Date: Tue, 04 Dec 1993 21:29:02 GMT.


<META name="robots" content="dyrektywa">

Polecenie jest wskazówką dla indekserów, czy strona i jej pochodne mają być indeksowane. Domyślnie stosowane jest indeksowanie, ale możemy podać dyrektywę, wybierając kombinację index/noindex i follow/nofollow.

Index nakazuje indeksowanie strony, noindex zakazuje jej indeksowania. Follow nakazuje indeksowanie stron wskazywanych przez odsyłacze, nofollow zakazuje tej czynności.

Przykład:

<META name="robots" content="index, nofollow">

Zamiast pisać index, follow, możemy podać all. W miejsce noindex, nofollow możemy użyć none.

Uwaga: nie wszystkie roboty sieciowe rozpoznają tę dyrektywę.


<META HTTP-EQUIV="Page-Enter" CONTENT="filter:RevealTrans(Duration=3,Transition=23)">

Polecenie jest przykładem zastosowania przejść między stronami, interpretowanym jedynie przez Internet Explorer 4.01 lub nowszy. Możemy tutaj zastosować page-enter, page-exit, site-enter i site-exit. W Transition stosujemy numery filtrów graficznych od 1 do 28 (ich zestaw zawiera m.in. FrontPage), natomiast Duration określa czas trwania przejścia w sekundach. Filtry dają podobny efekt wizualny, jak przejścia między stronami w programach grafiki prezentacyjnej. Polecenie jest umieszczane na pierwszym miejscu listy poleceń META.

Przykład (Transition=1)

Przykład (Transition=2)

Przykład (Transition=3)

Przykład (Transition=4)

Przykład (Transition=5)

Przykład (Transition=6)

Przykład (Transition=7)

Przykład (Transition=8)

Przykład (Transition=9)

Przykład (Transition=10)

Przykład (Transition=11)

Przykład (Transition=12)

Przykład (Transition=13)

Przykład (Transition=14)

Przykład (Transition=15)

Przykład (Transition=16)

Przykład (Transition=17)

Przykład (Transition=18)

Przykład (Transition=19)

Przykład (Transition=20)

Przykład (Transition=21)

Przykład (Transition=22)

Przykład (Transition=23)

Przykład (Transition=24)

Przykład (Transition=25)

Przykład (Transition=26)

Przykład (Transition=27)

Przykład (Transition=28)


<META http-equiv="PICS-Label" content='(PICS-1.0 "http://www.rsac.org/ratingsv01.html" l gen false comment "RSACi North America Server" by "htmlib@htmlib.demon.co.uk" for "http://subnet.virtual-pc.com/~le387818/index.html" on "1996.04.04T08:15-0500" exp "1997.01.01T08:15-0500" r (n 0 s 0 v 0 l 0))'>

Jest to przykład (pochodzący z "HTML Reference Library 4") polecenia definiującego "cenzuralność" (rating) strony. Aby je zastosować, należy zgłosić stronę do serwisu zajmującego się wyceną zawartości stron, np. Recreational Software Advisory Council (RSAC), wypełniając formularz. RSAC przesyła ostateczną treść polecenia. W nawiasie są widoczne wyceny przykładowej strony: nudity - 0, sex - 0, violence - 0, language - 0. Wspomaganie PICS (Platform for Internet Content Selection) zawierają m.in. HotDog 4.5 i WebEdit 3.

Przeglądarka (Internet Explorer) interpretuje zawartość strony według zadeklarowanych wartości i wczytuje stronę albo nie, zależnie od przyjętych w opcjach ograniczeń. Jest to narzędzie, które pozwala blokować dostęp do niektórych stron, np. nieletnim do serwisów pornograficznych.

[zielona kropka]<BASE>

Polecenie definiuje bazowy adres dokumentu.

<BASE HREF="http://www.firma.com/dokument.html">

Polecenie w tej postaci zapewnia poprawność relatywnych odsyłaczy w dokumencie. Niekiedy dokumenty są przenoszone do innych miejsc, gdy wymaga tego porządek na serwerze. Jednak w dokumentach znajdują się zazwyczaj relatywne odsyłacze do innych stron na serwerze, a nie odsyłacze absolutne. Oznacza to, że nie jest w nich podawana pełna ścieżka dostępu, lecz jedynie jej fragmenty. Jest to znacznie wygodniejsze w trakcie konstruowania dokumentu.

Gdy dokument zostanie przeniesiony, może się zdarzyć, że odsyłacze stracą swoją aktualność, gdyż przeglądarka będzie je odnosić do nowego położenia dokumentu. Oczywiście poprawność wymagałaby w takiej sytuacji albo przeniesienia wszystkich dokumentów, do których odsyłacze znajdują się na danej stronie, albo ręcznego poprawienia adresów. Jedno i drugie może być bardzo kłopotliwe, a przeniesienie nawet z jakichś powodów niemożliwe. W takiej sytuacji wygodnym rozwiązaniem jest podanie <BASE> w nagłówku przenoszonej strony. Przeglądarka będzie automatycznie, "w locie" poprawiać adres w odsyłaczu, kierując się podanym adresem bazowym, który stanowi w tej sytuacji swoistą busolę.

[zielona kropka]<LINK>

Polecenie ma określać hierarchiczny porządek w zespole dokumentów dla celów nawigacyjnych. W tym miejscu warto o nim wspomnieć jedynie w kontekście stylów dołączanych, które w Internet Explorerze wpływają na postać wyświetlanego dokumentu (będzie o tym mowa w rozdziale poświęconym stylom).

Pełny zestaw poleceń LINK interpretuje jedynie przeglądarka NCSA Mosaic 3 (pamiętasz jeszcze taką nazwę?...)


[hand]Więcej szczegółów o BODY

Definiując <BODY> możemy wstawić dodatkowo kilka parametrów, które zadecydują o graficznej postaci strony.

[zielona kropka]<BODY BACKGROUND="URL albo ścieżka/nazwa_pliku.gif">

Parametr BACKGROUND="obrazek.gif" pozwala wybrać obrazek, który pokaże się w tle dokumentu w przeglądarce. (najlepiej, żeby się znajdował w tym samym katalogu co strona HTML) Jeśli np. będzie to <BODY BACKGROUND="lupus.gif">, w przeglądarce zobaczymy dokument w takiej postaci:

Kliknij w tym miejscu, aby zobaczyć przykład

Zauważmy, że niewielki objętościowo obrazek lupus.gif został powielony na szerokość i długość strony.

[zielona kropka]<BODY BGCOLOR="kolor">

Parametr BGCOLOR="kolor" pozwala wybrać kolor tła dokumentu, który pokaże się w tle dokumentu w przeglądarce. Gdyby był to <BODY BGCOLOR="yellow">, zobaczymy:

Kliknij w tym miejscu, aby zobaczyć przykład

Mam nadzieję, że nikogo nie rozbolały oczy od tego przykładu.

Uwaga: należy deklarować kolor tła strony, gdyż jeśli tego nie zrobimy, czytelnik strony zobaczy tło zależne od jego własnych ustawień w przeglądarce, białe, szare czy jakiekolwiek inne. Może to "zrujnować" wyświetlanie strony. Ponadto, gdy używamy pliku graficznego jako tła, także podawajmy alternatywny kolor tła strony, gdyż wiele osób wyłącza grafikę w przeglądarce - wtedy widoczny jest jedynie kolor tła strony.

[zielona kropka]<BODY TEXT="kolor">

Parametr TEXT="kolor" pozwala określić kolor tekstu w dokumencie. Wybierając kolor, należy mieć także na uwadze kolor tła.

Kliknij w tym miejscu, aby zobaczyć przykład

[zielona kropka]<BODY LINK="kolor1" VLINK="kolor2" ALINK="kolor3">

Możemy również określić kolory odsyłaczy. LINK="kolor" określa standardowy kolor odsyłacza. VLINK="kolor" (visited link) określa kolor odsyłacza, który został co najmniej raz użyty (zauważmy związek z ustawieniem przeglądarki u odbiorcy, który może na ogół swobodnie definiować czas "wygasania" informacji o wizytowaniu jakiegoś miejsca w Internecie). ALINK="kolor" (active link) określa kolor aktywnego odsyłacza Odsyłacz aktywny to odsyłacz w trakcie ładowania dowiązanego do niego dokumentu. Jeśli np. odsyłacz ma standardowo kolor niebieski, w momencie przywoływania dowiązanego dokumentu zmieni na chwilę swój kolor (właśnie zdefiniowany za pomocą ALINK="kolor"), natomiast gdy powrócimy do tej samej strony, zobaczymy, że odsyłacz ma już kolor zdefiniowany za pomocą VLINK="kolor", jako już co najmniej raz wizytowany. Możemy przykładowo użyć kolorów:

<BODY LINK="blue" VLINK="red" ALINK="yellow">

[zielona kropka]<BODY LEFTMARGIN="xx">

Microsoft Internet Explorer pozwala dodatkowo wprowadzić lewy margines strony. Wartość LEFTMARGIN="xx" spowoduje przesunięcie zawartości dokumentu o xx pikseli w prawo.

[zielona kropka]<BODY TOPMARGIN="xx">

Ta sama przeglądarka akceptuje kod wprowadzający górny margines strony. Wartość TOPMARGIN="yy" spowoduje przesunięcie zawartości dokumentu o yy pikseli w dół.

Kliknij w tym miejscu, aby zobaczyć przykład

Oba polecenia nie wchodzą w zakres standardu HTML 4.0.


[hand]Kilka uwag o wlewaniu tekstu

Bardziej szczegółowy opis formatowania bloków tekstu znajduje się na stronie Bloki, ale już w tym miejscu warto zasygnalizować podstawowe, związane z tym problemy.

Gdy redagujemy tekst w edytorze, jesteśmy przyzwyczajeni do używania klawisza Enter, aby oddzielać od siebie akapity. Jednak przeglądarka ignoruje znak końca akapitu i mimo oddzielenia od siebie akapitów w edytorze zostaną one złączone w przeglądarce w ciągłą linię. Dlatego każdy akapit powinniśmy umieszczać między parą znaczników <P> </P>. Jeśli wlewamy do edytora HTML tekst z innego źródła, musimy objąć każdy z akapitów osobną parą znaczników. Akapity są w przeglądarce oddzielane dodatkową interlinią, która uwypukla podział.
Możemy też posłużyć się pojedynczym (otwartym) znacznikiem <BR>, umieszczanym na końcu akapitu, który pozwoli oddzielić od siebie akapity, nie wprowadzając interlinii.

Kilka spacji obok siebie jest zamienianych na pojedynczą spację, tak więc nie można (poza tzw. stylem preformatowanym) wstawiać większej liczby spacji między wyrazami. Na tej samej zasadzie ignorowane są również tabulatory.

        Można jednak wstawiać znak tzw. niełamliwej spacji (&nbsp;), który pozwala wstawić kilka kolejnych spacji. Przykładem jest niniejszy akapit, którego pierwszy wiersz jest odsunięty od lewego marginesu o 8 spacji.