Podstawy stron WWW – XHTML
(X)HTML
Kod strony internetowej składa się ze znaczników języka html reprezentujących zdefiniowane elementy strony tj. odnośniki, akapity, tabele itp. Znacznik jest to ciąg znaków pomiędzy symbolami „<” i „>” np. <body>, <table>. Większość znaczników ma swoje wersje otwierające i zamykające, w których po symbolu „<” umieszcza się znak „/” np. <span> </span>. Znaczniki takie wpływają na wszystko co się pomiędzy nimi znajduje. Znaczniki nie mające swoich wersji zamykających zapisujemy w formie <br> na stronach w języku HTML lub <br /> w przypadku stosowania języka XHTML. Często znaczniki posiadają atrybuty modyfikujące ich wygląd lub funkcjonowanie np. <img src=”przykład.jpg” alt=”przykład” />. Nazwę atrybutu umieszcza się za nazwą znacznika, po spacji, następnie stawia się znak równości i w cudzysłowie ustawia się wartość atrybutu. Specyfikacja języka zaleca, by nie umieszczano przerw pomiędzy nazwą atrybutu, znakiem równości, znakami cudzysłowu i wartością atrybutu.
W kodzie strony możemy również umieścić komentarze. Wszystko, co zostanie umieszczone pomiędzy „<!-–” a „-–>”, nie będzie widoczne na stronie. Komentarze mogą posłużyć m.in. do umieszczania własnych uwag lub ukrycia fragmentów strony. Komentarzy nie można w sobie zagnieżdżać.
Struktura dokumentu składa się z trzech głównych elementów: znaczników <html></html>, w których zawiera się cały kod strony zapisany w HTMLU lub XHTMLU, znaczników <head></head> obejmujących część nagłówkową wpływającą na różne aspekty funkcjonowania strony w Internecie, ale nie wyświetlającą żadnych elementów na stronie, oraz znaczników <body></body> stanowiących główną część strony, wyświetlaną w przeglądarce. W znaczniku <body> nie można umieszczać tekstu w sposób bezpośredni. Tekst musi znajdować się w dodatkowych znacznikach.
html 4.01
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html> <head> </head> <!--komentarz --> <body> </body> </html> |
xhtml 1.0
<?xml version="1.0" encoding="ISO-8859-2"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl" lang="pl"> <!--komentarz --> <head> <title>Tytuł</title> </head> <body> </body> </html> |
xhtml 1.1
<?xml version="1.0" encoding="ISO-8859-2"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="pl"> <head> <title>Tytuł</title> </head> <body> <!--komentarz --> </body> </html> |
Przestrzegam przed używaniem kodowania ISO! Co będzie kiedy będziemy robić stronę w kilku językach (np. Polski, Niemiecki, Hiszpański)? W każdym z nich występują odmienne znaki diakrytyczne i całość nam się rozsypie… UTF-8 powinien być panaceum na wszystko, ale różnie też z nim bywa… Czy ta linia jest konieczna:
Walidator W3C nic nie płacze gdy jej brak
Kodowanie ISO wcale nie jest takie groźne, chociaż rzeczywiście UTF-8 zdobywa sobie coraz większą popularność i daje większe możliwości. Jeżeli chodzi o strony wielojęzyczne, to nic nie przeszkadza w tym, by np podstrony w języku hiszpańskim, niemieckim czy francuskim kodować w ISO-8859-1. UTF-8 będzie konieczny dopiero, gdy zechcemy publikować treści w kilku językach na jednej podstronie.
I druga sprawa „Czy ta linia jest konieczna:” Domyślam się, że chodzi o linię: <?xml version=”1.0″ encoding=”ISO-8859-2″?>. Otóż jest ona konieczna w przypadku kodowania ISO-8859-2, dlatego właśnie tego kodowania użyłem w przykładzie. Natomiast przy UTF-8 można ją pominąć, gdyż w XML-u, a co za tym idzie w XHTML-u kodowanie UTF-8 jest kodowaniem domyślnym.