「docx2md」でワード文書をMarkdownに変換する

Microsoft Word を Markdown に変換するコマンド「docx2md」を作った」と言う記事を見つけました。

現在取り組んでいる「ナビゲーション・ドキュメント(略して「ナビドク」)」と言うサービスは、MS-Wordで「見出し1~4」を使って作成してあれば、「見出し1~4」は「節、項」としてシンプルな構造化文章として社内文書を共有できるようにすることを目指しています。

ワード文書のまま(あるいはPDFにして)共有すればいいという考え方もありますので、それはそれとして否定するものではありませんが、構造的に文書を捉えてみるという考え方は「SGML」などを源流に持つもので、日本では見事に定着しませんでした。

ナビドク」では、MS-Wordにスタイルで「見出し」を使い、「表示」-「ナビゲーション」にチェックを入れた表示に近似させたHTMLファイルとして加工します。

HTMLを、このワード文書のような構成にする

これがマニュアルであったりするとページ数が膨大になることもあり得ますが、「ナビドク」では「見出し2」、つまり「」単位でHTMLを1ファイルに切り出します。

HTMLファイルだからと言ってwebサーバー上での使用を考えておらず、クラウドのストレージやNASなどのローカルなストレージなどでも表示させられますので、「ワードで書く」「MarkDownに変換する」「切り出しなどの加工をする」「ストレージの所定の場所に置く」ことで共有することを可能にします。

現在は、MarkDownファイルをHTMLにするためにTyporaというエディタを使用していますが、ゆくゆくは専用ツールでMrakDownファイルからHTMLに直接変換しなければ広がらないだろうとは思っています。

その話は別の場面でするとして、記事タイトルの「docx2md」という、ワード文書のMarkDownへの変換ツールを使えるようになるまでを記事にしました。

たまたま、MarkDownを使って「Q&A」や「職務手順書(Job Procedure)」の実装方法を考えていたタイミングでもあって、さっそく入手してみようとしました。

が、「docx2md」に関連する記事の数が意外と少なく、どの記事も結局は同じことが書かれており、そしてなにをどうしたところで「GitHub」につながってしまいます。

ここにあるいろいろなリンクをクリックしても外国の食堂でメニューをみているような感じで、なにがどうなっているのが分かりません。

欲しいのは「docx2md.exe」なのですが、簡単には行きませんでした。

Big Sky」の記事を読むと、「go」と言う言語で作ったポイように思ったので、特に根拠もなく、まず、「go」をインストールしました。

go」のインストールは「Qiita」の「WindowsにGo言語開発環境をインストールする」を参考にしました。

go」と言う言語が必要な雰囲気は作者の記事やGitHubの拡張子や「Installation」などから「もしかして」と思った次第です。

Installation」に書いてあるのは、

ということで、さっそく、コマンドラインからやってみました。

と、何かが動き「GitHub」と連携して何かが動いたようで、

とするとバージョンが表示されます。

これで、ワード文書をMarkDownに変換する環境が整いました。

といっても、これだけで完結する場面は、きっと少なくて、ここから先にもいくつかの仕組みを作らなければならないとは思うものの、少し前進できました。