Po co w HTML jest atrybut lang=””?

Może część z Was zajmująca się HTML’em, zadała sobie trud przeczytania specyfikacji tego języka i zauważyła że głównym znaczniku html jest możliwość umieszczenia atrybutu lang. Ja o tym wiedziałem ale nigdy nie wiedziałem do czego może on w praktyce służyć. I dowiedziałem się dopiero w tym miesiącu, po 16 latach korzystania z HTML (tak, tak, pierwszy napisany website www.7nfi.com.pl w 1998…).

W praktyce powinno wyglądać to tak:

<html lang="pl">
...
</html>

Otóż okazało się że z tej informacji może korzystać przeglądarka do zmieniania wielkości liter, np. do „uppercase” przy pomocy CSS (styli).

Poniższy kod wyrenderuje nam jako wynik testu z małej litery „i” dużą literę „I”:

<html>
  <body>
    <p>Test: 
      <span style="text-transform:uppercase;">i</span>
    </p>
  </body>
</html>

Duże "i"

Kłopot zaczyna się wtedy gdy używamy innego języka niż polski czy angielski, np. turecki. Okazało się że w nim duża litera „i” to wcale nie jest „I” tylko „İ” (z kropką na górze, U+0130). Natomiast duże „I” bez kropki to jest duża wersja małego „ı” (małe i bez kropki, U+0131). Poniższa tabelka ze strony prezentuje obydwie litery w dużej i małej wersji:

Tabela liter i dla języka tureckiego

Nieźle, nie?

Jeżeli o tym nie wiemy (jak ja dotychczas), to poprawne słowo napisane małymi literami zamienione stylami na duże, staje się „trochę innym” słowem, ale dla Turka będzie to słowo błędne. Dopiero poinformowanie przeglądarki, że strona jest w języku tureckim powoduje, że uppercase zaczyna działać dobrze:

<html lang="tr">
  <body>
    <p>Test: 
      <span style="text-transform:uppercase;">i</span>
    </p>
  </body>
</html>

screenshot_test_2

O autorze

Marek Berkan: programista, entuzjasta tworzenia oprogramowania, zarządzania zespołami technicznymi. Prywatnie motocyklista, kolarz MTB, biegacz, żeglarz, rekreacyjny wspinacz, zamiłowany turysta. Witryny: google plus, facebook, twitter.

More at

2 komentarze do “Po co w HTML jest atrybut lang=””?”

Marek Berkan Autor wpisu18 września 2014 o 19:07

Od kolegi który zajmuje się tematem lokalizacji aplikacji na inne języki dostałem jeszcze jednego ciekawego newsa, którego cytuję:

Okazuje się, że mechanizm w przeglądarce jest całkiem inteligentny, bo np. zamienia niemieckie ß, które występuje tylko jako mała litera na „SS”. Co ciekawe, jak się skopiuje taki napis z ekranu i wklei do edytora tekstowego, to jest w nim „SS”. Jak się zrobi „Zbadaj element”, to w stronie HTML pokazuje się oryginalne ß. Ciekawe co byłoby w drzewie DOM, jakby odczytać np. przez JS.

Wygląda na to, że mechanizm obsługi CSS i wyświetlania strony w przeglądarce robi więcej niż mi się wydawało.

Odpowiedz ↓

Agnieszka 9 listopada 2021 o 15:47

W praktyce powinno być:

zgodnie ze standardem.

Odpowiedz ↓

Marek Berkan Zawodowo (PL)

Przemyślenia na temat technologii i pracy przy aplikacja JEE

O autorze

2 komentarze do “Po co w HTML jest atrybut lang=””?”

Dodaj komentarz Anuluj pisanie odpowiedzi