petek, 22. oktober 2010

Vaja 03 - Ubuntu live cd ter Kodne tabele

Kodne tabele

Črke in drugi znaki so v računalniku predstavljeni s pomočjo tabele, imenovane kodna tabela  ali kodni razpored , ki povezuje grafično predstavitev nekega znaka z njegovim binarnim zapisom.



Character encoding:


Za spreminjanje strani z character encoding sem si izbral stran http://www.rutar.com/pohistvo/ .
S spreminjanjem character encoinga se črke s šumniki na strani spremenijo v različnejše znake. Kar pomeni, da smo uporabili character encoding kodiranje znakov.
V večini primerov se kodiranje znakov določi samodejno, zato ročna nastavitev ni potrebna. Na nekaterih straneh ni mogoče spreminjati in nastaviti kodiranje znakov.


Razlike med ASCII, Win-1250 in UTF-8 :


ASCII ( American Standard Code for information intercharge) :
Je ameriški standardni nabor za izmenjavo informacij.
Je 7-bitni nabor znakov kar obsega 2 na 7 = 2x2x2x2x2x2x2 =128 znakov. To je sistem znakov.
Večina sodobnih znakov kodiranj shem, temeljijo na ASCII

Kot Primer ASCII tabela .



Win-1250 (Windows-1250) :
To je oznaka strani v okviru Microsoft windows za predstavitev v vzhodnoevropskih in srednjoevropskih jezikih, kot so npr:
slovenski, češki, hrvaški, madžarski, bosanski, romunski, srbski, slovaški ter albanski.Uporabljajo se lahko tudi v nemškem jeziku.
V nemškem jeziku besedil kodirani z Windows-1250 in Windows-1252 so enaki.

 UTF-8 :
Je eden izmed načinov kodiranje mednarodnega nabora znakov unicode, pri katerem znaki ASCII ostanejo enozložni, ostali znaki pa lahko zasedejo več zlogov.

 V sodobnih aplikacij UTF-8 ali UTF-16 je prednost v kodiranju.


Kodni zapis mojega imena v binarni obliki:


        DENIS BRINJEVEC

  • ASCII:Ime: (D:01000100)-(E-01000101)-(N:01001110)-(I:01001001)-(S:01010011)
    Priimek: (B-01000010)-(R:01010010)-(I:01001001)-(N:01001110)-(J:01001010)-(E:01000101)-(V:01010110)-(E:01000101)-(C:01000011)
  • Win-1250:
    Ime: (D:0x0044)-(E:0x0045)-(N:0x004E)-(I:0x0049)-(S:0x0053)
    Priimek: (B:0x0042)-(R:0x0052)-(I:0x0049)-(N:0x004E)-(J:0x004A)-(E:0x0045)-(V:0x0056)-(E:0x0045)-(C:0x0043)
  • UTF-8:
    Ime: (D:00068)-(E:00069)-(N:00078)-(I:00073)-(S:00083)
    Priimek: (B:00066)-(R:00082)-(I:00073)-(N:00078)-(J:00074)-(E:00069)-(V:00086)-(E:00069)-(C:00067)













































































































































Ni komentarjev:

Objavite komentar