今回はちょっと諸事情により勉強したけど使わなかった、HTMLファイルをXMLファイルへと変換する方法についてご紹介していきます。
ソースコード
gist160f440139e6ee8b3a1745a9912fb2fc
注意点
参考記事では『from spire.doc import *』にしており、こちらの方が記述内容が簡潔になりやすいです。
ただし他のライブラリも同じようにインポートした時に衝突問題を引き起こすため、本記事ではこのようにas(エイリアス)を付けて回避しています。
この辺りを詳しく知りたい人は、下記の記事をご覧ください。
【Python】パッケージやモジュールをインポートする時の基本知識まとめ! - TomoGのごちゃまぜ倉庫
余談
今回なぜHTMLをXMLへ変換しようと思い立ったのかというと、諸事情で別サイトの記事をはてなブログへ移転させようとしたからです。
その時はXMLファイルっていうから、記事のHTMLファイルを1記事ずつインポートしていけばいいだろって思ってたんですが、そんな話ではなかったようで・・・
結局下記の記事を作ってた時に使用していたWordpressにコピーしてからエクスポートすることで解決しました。
【Local】ローカル環境でWordpressを使用する方法をご紹介! - TomoGのごちゃまぜ倉庫
ただ無駄に終わったと言っても一応調べたことなので、今回記事にした次第です。
参考記事
本記事の内容は以上となります。