Java 將HTML轉為XML

2022-06-20 12:00:54

本文介紹如何通過Java後端程式程式碼來展示如何將html轉為XML。此功能通過採用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法來實現;該方法支援的目標檔案格式多達 30餘種。另外,該API也提供了多種方法,如Document.saveToEpub()Document.saveToFile()Document.saveToImages()Document.saveToSVG()Document.saveToTxt()、Document.saveToTiff()等,可用於將原始檔轉為Epub、圖片、文字檔案等目標檔案格式。

下面,將以html轉為xml格式為例,介紹如何實現轉換。以下是詳細方法及步驟。


【關於如何匯入jar包】

通過 Maven倉庫 下載匯入,如下設定pom.xml:

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>5.2.0</version>
    </dependency>
</dependencies>

如需手動匯入,需要下載 jar包 到本地,然後解壓,找到lib資料夾下的Spire.Doc.jar檔案。在IDEA中開啟「Project Structure」介面,執行如圖步驟將本地路徑下的jar檔案手動引入Java程式:

 

【將 HTML 轉為 XML

轉換時,可參考如下程式碼步驟:

  • 建立Document類的物件。
  • 呼叫Document.loadFromFile(String fileName, FileFormat fileFormat)方法載入HTML檔案。
  • 通過Document.saveToFile(String fileName, FileFormat fileFormat)方法儲存為XML格式到指定路徑。

Java

import com.spire.doc.*;

public class HTMLtoXML {
    public static void main(String[] args) {
        //建立Document類的物件
        Document doc = new Document();

        //載入html檔案
        doc.loadFromFile("sample.html",FileFormat.Html);

        //儲存為XML格式
        doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
    }
}

轉換效果:

 

—END—