SITE PAIEŠKA

Teksto informacijos kodavimas kompiuteryje

Kompiuteris yra sudėtingas įrenginys, kurio pagalbakuri gali kurti, konvertuoti ir saugoti informaciją. Tačiau kompiuteris mums ne visai suprantamai veikia - grafiniai, tekstiniai ir skaitiniai duomenys saugomi kaip dvejetainiai matricai

teksto informacijos kodavimas
numeriai. Šiame straipsnyje apžvelgsime, kaip tekstinė informacija yra koduota.

Kas mums yra skirtas tekstui, kompiuteriui -simbolių seka. Kiekvienas simbolis reiškia tam tikrą nulių ir vienetų rinkinį. Pagal simbolius reiškia ne tik lotyniškos abėcėlės mažosios ir didžiosios raidės, bet ir skyrybos ženklai, aritmetiniai ženklai, aptarnavimo simboliai, specialieji simboliai ir net erdvė.

Tekstinė informacijos dvejetainis kodavimas

Kai paspausite tam tikrą klavišą ant vidiniovaldiklis siunčia elektrinį signalą, kuris yra paverčiamas dvejetainiu kodu. Kodas suderinamas su konkrečiu simboliu, kuris rodomas. Lotynų abėcėlė skaitmenine forma buvo sukurta tarptautinė ASCII kodavimo sistema. Norint rašyti vieną simbolį, reikia 1 baito, todėl simbolį sudaro aštuonių skaitmenų nulių ir jų eilučių seka. Įrašymo intervalas yra nuo 00000000 iki 11111111, tai yra, teksto informacijos kodavimas naudojant šią sistemą leidžia pateikti 256 simbolius. Daugeliu atvejų tai yra pakankamai.

tekstinė informacijos dvejetainis kodavimas

ASCII yra padalintas į dvi dalis. Pirmieji 127 simboliai (nuo 00000000 iki 01111111) yra tarptautiniai ir yra specifiniai anglų abėcėlės simboliai ir raidės. Antroji dalis - pratęsimas (nuo 10 000 000 iki 11 11 11 11) - reiškia nacionalinę abėcėlę, kurios rašymas skiriasi nuo lotynų.

Teksto informacijos kodavimas ASCII formatuyra pagrįstas didėjančios sekos principu, ty kuo didesnis lotyniškos raidės skaičius, tuo didesnė jo ASCII kodo vertė. Lentelės figūros ir rusų dalis yra pagrįsti tuo pačiu principu.

Tačiau pasaulyje yra dar keletas rūšiųkoduotę kirilica. Dažniausiai - tai KOI-8 (aštuonių bitų kodavimas, kad buvo naudojamas per 70s į pirmą ruifitsirovannyh Unix operacinės sistemos), ISO 8859-5 (sukurta Tarptautinės standartizacijos biuras), CP 1251 (kodavimo tekstinę naudojama informacija

teksto informacijos kodavimas ir apdorojimas
moderni Windows operacinė sistema), taip pat 2 baitųUnicode kodavimas, kurį galite pateikti 65536 simbolių. Tokios koduotės įvairovė yra ta, kad jie buvo sukurti skirtingais laikais, skirtingoms operacinėms sistemoms ir dėl įvairių priežasčių. Dėl to dažnai sunku perkelti tekstą iš vienos aplinkos į kitą - jei kodavimai nesutampa, vartotojas pamatys tik nesuprantamų piktogramų rinkinį. Kaip galite išspręsti šią situaciją? Pavyzdžiui, "Word", atidarius dokumentą, gaunate pranešimą apie teksto rodymo problemas ir siūlo keletą transkodavimo parinkčių.

Taigi, teksto kodavimas ir apdorojimasinformacija kompiuterio gilumoje - procesas yra gana sudėtingas ir daug laiko. Visi simboliai bet kokios abėcėlės rodo tik tam tikrą skaičių skaitmenų iš dvejetainių sistemos, viena ląstelė yra vienas baitas informacijos.

</ p>
  • Reitingas: