close button

Encoding: Pengertian, Sejarah, & Terminologi (LENGKAP 2022)

  •   Sep 2022  •   7 min read  •   Comment

Encoding – Kata Encoding memiliki bermacam pengertian tergantug dari sudut pandanganya.

Dalam ilmu komunikasi, kata encoding mengacu pada proses pembuatan pesan oleh si pengirim atau encoder yang akan disampaikan ke penerima.

Sederhananya, encoding atau pengkodean karakter ini merupakan proses menetapkan angka ke karakter grafis.

Encoding berkaitan dengan proses penulisan kode seperti karakter – karakter tertentu dalam bida komputer atau programming.

Nah, agar kamu lebih paham mengenai pengertian encoding, simak ulasannya di artikel ini, ya!

Encoding Adalah

Secara umum, encoding merupakan perubahan data dalam format yang sesuai untuk kebutuhan pemrosesan informasi, yaitu:

  • Kompilasi dan eksekusi program
  • Transmisi data
  • Penyimpanan dan kompresi atau dekompresi, dan
  • Pemrosesan data aplikasi; Konversi file

Adapun pengkodean ini dapat didefinisikan sebagai:

Dari perspektif Sains Komputer: Pengkodean ialah proses penerapan kode tertentu, seperti simbol, huruf, dan angka ke data untuk diubah menjadi sandi yang setara.

Dalam perspektif Elektronik: Pengkodean merujuk pada proses pengubahan data analog menjadi data digital.

Sedangkan dalam perspektif Komunikasi: Pengkodean merupakan perubahan pikiran menjadi komunikasi.

Sejarah Encoding

Encoding

Sejarah encoding ini menggambarkan kebutuhan yang berkembang, khususnya pada informasi simbolis berbasis karakter yang dimediasi oleh mesin dari jarak jauh yang menggunakan sarana listrik.

Kode paling awal ini didasari pada pengkodean manual, tulisan tangan, dan sistem sandi seperti;

  • Sandi Bacon
  • Braille
  • Bendera Sinyal Maritim Internasional, dan
  • Pengkodean 4 digit karakter Cina untuk kode telegraf Cina

Dengan mengadopsi elektro-mekanis dan teknik listrik, kode – kode ini disesuaikan dengan kemampuan dan keterbatasan abru di mesin – mesin encoding jaman dulu.

Kode karakter yang diubah secara elektrik merupakan Kode Morse yang dikenalkan pada tahun 1840-an dengan sistem empat simbol (sinyal pendek, sinyal panjang, ruang pendek, ruang panjang) yang nantinya akan menghasilkan kode dengan variabel panjang.

Meskipun beberapa pengguna Kode Morse ialah melalui mesin, namun sering juga digunakan sebagai kode manual yang dihasilkan dengan tangan pada kunci telegraf, juga bisa didengar di telinga, radio dan pengguna aeronautika.

Contoh yang paling umum dari sistem encoding ini ialah Kode Morse, Kode Baudot, Kode Standar Amerika untuk Pertukaran Informasi (ASCII), dan Unicode.

Baca Juga: 10 Kode Alam Kucing Mati Berdasarkan Berbagai Indikator

Terminology

Encoding

Terminologi terkait Pengkodean Karakter

Berikut beberapa terminologi tentang encoding atau pengkodean karakter:

  • Karakter adalah unit teks minimal yang memiliki nilai semantik.
  • Kumpulan karakter adalah kumpulan karakter yang dapat digunakan oleh berbagai bahasa. Contoh: set karakter Latin digunakan oleh bahasa Inggris dan sebagian besar bahasa Eropa, meskipun set karakter Yunani hanya digunakan oleh bahasa Yunani.
  • Kumpulan karakter berkode adalah kumpulan karakter di mana setiap karakter sesuai dengan nomor unik.
  • Titik kode dari kumpulan karakter berkode adalah nilai apa pun yang diizinkan dalam kumpulan karakter atau ruang Kode.
  • Ruang Kode adalah rentang bilangan bulat yang nilainya adalah titik kode
  • Unit kode adalah “ukuran kata” dari skema pengkodean karakter, seperti 7-bit, 8-bit, 16-bit. Dalam beberapa skema, beberapa karakter dikodekan menggunakan beberapa unit kode, menghasilkan pengkodean panjang variabel. Unit kode disebut sebagai nilai kode dalam beberapa dokumen.

Repertoar karakter (kumpulan karakter abstrak):

Repertoar karakter adalah kumpulan abstrak lebih dari satu juta karakter yang ditemukan dalam berbagai macam script termasuk Latin, Sirilik, Cina, Korea, Jepang, Ibrani, dan Aram.

Simbol lain seperti notasi musik juga termasuk dalam repertoar karakter.

Baik standar Unicode dan GB 18030 memiliki repertoar karakter, saat karakter baru ditambahkan ke satu standar, standar lainnya juga menambahkan karakter tersebut, untuk mempertahankan paritas.

Ukuran Unit Kode Setara

Ukuran Unit Kode Setara dengan pengukuran bit untuk pengkodean tertentu:

  • Unit kode di AS-ASCII terdiri dari 7 bit;
  • Unit kode dalam UTF-8, EBCDIC dan GB 18030 terdiri dari 8 bit;
  • Unit kode dalam UTF-16 terdiri dari 16 bit;
  • Unit kode dalam UTF-32 terdiri dari 32 bit.

Unicode Encoding Model

Unicode, kumpulan karakter universal ISO/IEC 10646 merupakan encoding terpadu yang modern.

Mereka secara terpisah menentukan karakter apa yang tersedia, bilangan asli yang sesuai, bagaimana angka tersebut dikodekan sebagai unit kode, dan bagaimana unit tersebut dikodekan sebagai aliran oktet.

Tujuan dari dekomposisi ini ialah untuk membangun satu set universal karakter yang bisa dikodekan dalam berbagai cara.

Untuk menggambarkan model ini dengan benar, maka dibutuhkan istilah yang lebih tepat dibanding “set karakter” dan “enconding”.

Istilah yang digunakan dalam model moder mengikuti:

Repertoar Karakter

Set lengkap karakter abstrak yang didukung oleh sistem.

Repertoar dapat ditutup, yaitu tidak ada tambahan yang diizinkan tanpa membuat standar baru.

Atau mungkin terbuka yang memungkinkan adanya penambahan.

Karakter dalam repertoar tertentu mencerminkan keputusan yang sudah dibuat tentang membagi sistem penulisan menjadi unit informasi dasar.

Set Karakter Berkode

Set Karakter Berkode atau CCS berfungsi untuk memetakan karakter ke titik kode.

Beberapa CCS ini dapat berbagi repertoar yang sama.

Character Encoding Form

Character Encoding Form atau CEF ialah pemetaan titik kode ke unit kode untuk memfasilitasi penyimpanan dalam sistem yang mewakili angka sebagai urutan bit dengan panjang yang tetap.

Skema Pengkodean Karakter

Skema Pengkodean Karakter atau CES merupakan pemetaan unit kode ke urutan oktet untuk memfasilitasi penyimpanan pada sistem file berbasis transmisi atau oktet melalui jaringan berbasis oktet.

Skema Pengkodean Karakter ini termasuk:

  • UTF-8
  • UTF-16be
  • UTF-32be
  • UTF-16le atau UTF-32le

Sedangkan Skema Pengkodean Karakter Majemuk, seperti:

  • UTF-16
  • UTF-32, dan
  • ISO/IEC 2022

Unicode Model ini menggunakan istilah Peta Karakter untuk sistem historis yang secara langsung menetapkan urutan karakter ke urutan byte yang mencakup semua lapisan CCS, CEF, dan CES.

Set karakter, Peta karakter dan Halaman Kode

Secara historis, istilah “encoding”, “peta karakter”, “kumpulan karakter”, dan “halaman kode” identik dalam ilmu komputer, karena standar yang sama akan menentukan repertoar karakter juga bagaimana mereka dikodekan dalam aliran unit kode.

Namun sekarang istilah tersebut mempunyai arti tersendiri, karena upaya badan standar untuk memakai terminologi yang pas saat menulis mengenai dan menyatukan banyak sistem pengkodean berbeda – beda.

“Halaman Kode” biasanya memiliki arti pengkodean berorientasi byte, namun berkaitan dengan beberapa rangkaian pengkodean.

“Pengkodean Karakter” atau encoding adalah peta dari karakter abstrak ke kata kode.

“Set Karakter” dalam bahasa HTTP memiliki arti yang sama dengan pengkodean karakter, tetapi tidak sama dengan CCS.

Terjemahan Pengkodean Karakter

Sebagai hasil dari metode pengkodean karakter yang digunakan, banyak program komputer yang sudah mengembangkan untuk menerjemahkan data sebagai bentuk transcoding data, di antaranya:

Cross-Platform:

Berikut pengertian dari aplikasi untuk transcoding data:

  • Browser Web – Sebagian besar browser web modern menampilkan deteksi pengkodean karakter otomatis. Di Firefox 3, misalnya, lihat submenu View/Character Encoding.
  • iconv – Program dan API standar untuk mengkonversi pengkodean.
  • luit – Program yang mengubah pengkodean input dan output ke program yang berjalan secara interaktif.
  • convert_encoding.py – Utilitas berbasis Python.
  • decodeh.py – Algoritma dan modul untuk menebak pengkodean string secara heuristik.
  • Komponen internasional untuk Unicode – Satu set C dan Java Library untuk melakukan konversi charset. uconv dapat digunakan dari ICU4C.
  • chardet – Terjemahan dari Mozilla yang secara otomatis encoding akan terdeteksi ke dalam bahasa komputer Python.
  • Versi yang lebih baru dari perintah file Unix mencoba melakukan deteksi dasar pengkodean karakter (juga tersedia di Cygwin).
  • charset-C ++ perpustakaan template dengan antarmuka yang sederhana untuk mengkonversi antara aliran C ++ dan user-defined. Charset didefinisikan sebagai set karakter dan memungkinkan untuk menggunakan format Unicode dengan dukungan endianness.

Unix-like:

Berikut pengertiannya:

  • cmv – Alat sederhana untuk transcoding nama file.
  • convmv  – Mengkonversi nama file dari satu encoding yang lain.
  • cstocs – Mengkonversi isi file dari satu encoding yang lain untuk bahasa Ceko dan Slovakia.
  • enca – Analisis pengkodean untuk file teks yang diberikan.
  • recode – Mengkonversi isi file dari satu encoding yang lain, dan
  • utrac – Mengkonversi isi file dari satu encoding yang lain.

Windows:

Berikut pengertiannya:

  • Encoding.Convert -. NET API.
  • MultiByteToWideChar/WideCharToMultiByte – Konversi dari ANSI ke Unicode & Unicode ke ANSI.
  • cscvt – Alat konversi set karakter, dan
  • enca – Analisis pengkodean untuk file teks yang diberikan.

Baca Juga: Decoder: Pengertian, 3 Jenis, Aplikasi dan Cara Kerjanya

Kesimpulan

Encoding adalah proses perubahan data dalam format yang disesuaikan untuk kebutuhan seperti transmisi data, eksekusi program, penyimpanan data, dan sebagainya.

Seiring berjalannya waktu, pengertian encoding mengalami cukup banyak perubahan seperti yang telah carakami.com bahas di atas.

Ingin menambah ilmu lebih banyak lagi? Yuk baca – baca artikel carakami.com lainnya!

Orang juga bertanya

English private teacher, seo writter, english translator, and content writer.

Tinggalkan komentar