Encode String Python ()

Metode encode () string mengembalikan versi yang dikodekan dari string yang diberikan.

Sejak Python 3.0, string disimpan sebagai Unicode, yaitu setiap karakter dalam string diwakili oleh titik kode. Jadi, setiap string hanyalah urutan poin kode Unicode.

Untuk penyimpanan string ini secara efisien, urutan poin kode diubah menjadi satu set byte. Proses tersebut dikenal sebagai encoding .

Ada berbagai penyandiaksaraan yang memperlakukan string secara berbeda. Pengkodean yang populer adalah utf-8 , ascii , dll.

Dengan menggunakan encode()metode string , Anda dapat mengonversi string yang tidak dikodekan menjadi penyandiaksaraan apa pun yang didukung oleh Python. Secara default, Python menggunakan encoding utf-8 .

Sintaks encode()metode adalah:

 string.encode (encoding = 'UTF-8', kesalahan = 'ketat')

Parameter encode () string

Secara default, encode()metode tidak memerlukan parameter apa pun.

Ini mengembalikan versi string yang dikodekan utf-8. Jika terjadi kegagalan, ini menimbulkan UnicodeDecodeErrorpengecualian.

Namun, dibutuhkan dua parameter:

  • encoding - jenis encoding string yang harus dikodekan
  • kesalahan - respons saat encoding gagal. Ada enam jenis respons kesalahan
    • tight - respons default yang memunculkan pengecualian UnicodeDecodeError jika gagal
    • abaikan - mengabaikan unicode yang tidak dapat dikodekan dari hasil
    • replace - mengganti unicode yang tidak dapat dikodekan menjadi tanda tanya ?
    • xmlcharrefreplace - menyisipkan referensi karakter XML sebagai ganti unicode yang tidak dapat disandikan
    • backslashreplace - menyisipkan urutan pelolosan uNNNN sebagai ganti unicode yang tidak dapat disandikan
    • namereplace - menyisipkan urutan pelolosan N (…) sebagai ganti unicode yang tidak dapat disandikan

Contoh 1: Enkode ke Pengkodean Utf-8 Default

 # unicode string string = 'pythön!' # print string print('The string is:', string) # default encoding to utf-8 string_utf = string.encode() # print result print('The encoded version is:', string_utf) 

Keluaran

Stringnya adalah: pythön! Versi yang disandikan adalah: b'pyth xc3 xb6n! '

Contoh 2: Enkode dengan parameter kesalahan

 # unicode string string = 'pythön!' # print string print('The string is:', string) # ignore error print('The encoded version (with ignore) is:', string.encode("ascii", "ignore")) # replace error print('The encoded version (with replace) is:', string.encode("ascii", "replace")) 

Keluaran

Stringnya adalah: pythön! Versi yang dikodekan (dengan mengabaikan) adalah: b'pythn! ' Versi yang dikodekan (dengan ganti) adalah: b'pyth? N! '

Catatan: Coba juga parameter encoding dan error yang berbeda.

Artikel yang menarik...