【Python】HTMLファイルをXMLファイルへ変換する方法をご紹介!

本ページには、プロモーションが含まれています。

今回はちょっと諸事情により勉強したけど使わなかった、HTMLファイルをXMLファイルへと変換する方法についてご紹介していきます。

ソースコード

gist160f440139e6ee8b3a1745a9912fb2fc

注意点

参考記事では『from spire.doc import *』にしており、こちらの方が記述内容が簡潔になりやすいです。

ただし他のライブラリも同じようにインポートした時に衝突問題を引き起こすため、本記事ではこのようにas(エイリアス)を付けて回避しています。

この辺りを詳しく知りたい人は、下記の記事をご覧ください。

余談

今回なぜHTMLをXMLへ変換しようと思い立ったのかというと、諸事情で別サイトの記事をはてなブログへ移転させようとしたからです。

その時はXMLファイルっていうから、記事のHTMLファイルを1記事ずつインポートしていけばいいだろって思ってたんですが、そんな話ではなかったようで・・・

結局下記の記事を作ってた時に使用していたWordpressにコピーしてからエクスポートすることで解決しました。

ただ無駄に終わったと言っても一応調べたことなので、今回記事にした次第です。

参考記事

qiita.com

本記事の内容は以上となります。