XML編碼


編碼 是Unicode字元轉換為等效的二進位制表示的過程。當XML處理器讀取XML文件,它編碼依賴於編碼的型別的檔案。因此,我們需要指定XML宣告的編碼型別.

編碼型別

主要有兩種型別的編碼:

  • UTF-8
  • UTF-16

UTF代表UCS轉換格式,但UCS的意義是通用字元集。編號8或16中的指用來表示一個字元的位元數。它們或者是8(一個位元組)或16(兩個位元組)。對於沒有編碼資訊的檔案,UTF-8的預設設定.

句法

編碼型別被包括在XML文件的序言部分。句法為UTF-8編碼方式如下圖所示:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

UTF-16 編碼的句法

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

例子

下面的例子顯示的宣告編碼:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
   <name>Tanmay Patil</name>
   <company>YiiBai</company>
   <phone>(011) 123-4567</phone>
</contact-info>

在上面的例子中的編碼=“UTF-8”,則指定的8位元被用於表示字元。來表示的16位元字元,UTF-16編碼可使用.

UTF-8編碼的XML檔案比UTF-16格式的檔案更小.