Meta Charset Tag HTML5 formātā

Rakstzīmju kodēšanas iestatīšana HTML5 formātā

Pirms HTML5 ieviešanas tiek iestatīts rakstzīmju kodējums dokumentā ar elementrequiredyou, lai rakstītu nedaudz verbose līniju, kas redzama zemāk. Šie ir Meta Charset elementi, ja savā tīmekļa lapā izmantojat HTML4:

Svarīgi atzīmēt šajā kodrakstā pēdiņas, kuras redzat satura atribūtā: content = " text / html; charset = iso-8859-1 " . Tāpat kā visi HTML atribūti, šīs pēdiņas nosaka atribūta vērtību, norādot, ka viss string teksts / html; charset = iso-8959-1 ir šī elementa saturs . Tas ir pareizi HTML un tā kā šī virkne bija domāta rakstīšanai. Tas ir arī smags garš un neglīts! Tas arī nav tas, ko jūs, iespējams, atcerēsit no savas galvas augšdaļas! Lielākajā daļā gadījumu tīmekļa izstrādātājiem vajadzētu kopēt un ielīmēt šo kodu no vienas vietnes uz jebkuru jaunu, ko viņi izstrādāja, jo daudzi to lūdza rakstīt no nulles.

HTML5 noņem papildu materiālus & # 34;

HTML5 ne tikai pievienoja valodai vairākus jaunus elementus , bet arī ievērojami vienkāršoja daudzas HTML sintakse, tostarp elementu Meta Charset. Ar HTML5 jūs varat pievienot savu rakstzīmju kodēšanu ar daudz vieglāk atcerēties META elementa sintaksi, kas jūs redzēsiet tālāk:

Salīdziniet šo vienkāršoto sintaksi ar to, ko mēs rakstījām šī raksta sākumā, veco sintakse, ko izmanto HTML4, un jūs redzēsiet, cik daudz vieglāk ir rakstīt un atcerēties HTML5 versiju patiešām ir. Tā vietā, lai kopētu un ielīmētu to no esošās vietnes uz jebkuru jaunu, kuru jūs strādājāt, tas ir pilnīgi kaut kas tāds, ko jūs varētu atcerēties kā starpposma tīmekļa izstrādātāju. Šim laika ietaupījumam daudzi nav daudz, taču, ja jūs apsvērsit citas HTML5 vienkāršotās sintakses jomas, ietaupījumi palielinās!

Vienmēr iekļaujiet rakstzīmju kodēšanu

Jūsu tīmekļa vietnēm vienmēr jāiekļauj rakstzīmju kodējums, pat ja jūs nekad nevēlaties izmantot īpašas rakstzīmes . Ja jūs neiekļausit rakstzīmju kodēšanu, jūsu vietne kļūst neaizsargāta pret krustiņu vietnes skriptu uzbrukumu, izmantojot UTF-7.

Šajā scenārijā anattacker redz, ka jūsu vietnē nav definēta rakstzīmju kodēšana, tāpēc tas pārlādē pārlieku domāt, ka lapas rakstzīmju kodēšana patiešām ir UTF-7. Nākamais uzbrucējs tīmekļa vietnē ievieto UTF-7 kodētos skriptus, un jūsu vietne tiek uzlauzta. Tas, protams, ir problemātisks visiem iesaistītajiem, no jūsu uzņēmuma līdz jūsu apmeklētājiem. Labā ziņa ir tāda, ka tā ir vienkārša problēma, ko izvairīties - vienkārši noteikti pievienojiet rakstzīmju kodēšanu visām jūsu tīmekļa lapām.

Kur pievienot rakstzīmju kodēšanu

Tīmekļa vietnes rakstzīmju kodēšanai jābūt HTML virsraksta elementa pirmajai rindiņai. Tas nodrošina, ka pārlūkprogramma zina, kas ir rakstzīmju kodējums, pirms tā dara kaut ko citu šajā lapā, nevis nosaka dokumenta tipu un identificē, ka tā ir HTML lapa. Jūsu HTML ir jālasa:

...

Izmantojot HTTP virsrakstus papildu drošības nodrošināšanai

Varat arī norādīt rakstzīmju kodēšanu HTTP galvenēs. Tas ir pat drošāks nekā pievienojot to HTML lapai, bet jums vajadzētu piekļūt servera konfigurācijām vai .htaccess failiem, kas nozīmē, ka jums, iespējams, būs jādarbojas ar jūsu vietnes mitināšanas pakalpojumu sniedzēju, lai iegūtu šādu piekļuvi vai padarītu to pieejamu izmaiņas tev. Piekļuve ir patiešām izaicinājums šeit. Patiešām izmaiņas ir vienkāršas, tāpēc jebkuram hostinga pakalpojumu sniedzējam būtu jāspēj veikt šīs izmaiņas relatīvi viegli.

Ja izmantojat Apache, jūs varat iestatīt noklusējuma rakstzīmju kopu visai vietnei, pievienojot: AddDefaultCharset UTF-8 savam root .htaccess failam. Apache noklusējuma rakstzīmju kopums ir ISO-8859-1 .