ソフトウェアに関する技術書(英語)を日本語で読む方法を考える

ソフトウェアの技術書を探すと、わりと新しい技術についての書籍は【英語版】しか出版されていない場合もある。日本語訳の書籍はすぐには出版されないものだ。紙の書籍じゃなくて電子書籍(英語版PDFファイル)の方は、現時点では公開されていて無料でダウンロードできるものもけっこう多い。
※(注)将来的には無料でなくなる可能性もある。

電子書籍を無料でダウンロードできたとしても、英語をスラスラと読めないもので。英文解釈に時間をかけたくないけど、英語の技術書をざっと読んでみたいものだな。翻訳する方法はいろいろある。

(方法1)
Google翻訳を使用する(適量の英文を翻訳する)。
→技術書の文章の量が多くなればなるほど、翻訳にかける時間・操作も多くなる。

(方法2)
Google翻訳(ドキュメント翻訳)を使用する。
※ドキュメント翻訳:PDFなどのファイル翻訳を行える。
→ファイルサイズ制限は、1 MB が上限(らしい)。技術書は1MBを超えてしまうファイルも多い。
サイズ上限を超えると以下のエラーが起きるようだ。

(方法3)
PDFファイルを分割してGoogle翻訳(ドキュメント翻訳)を使用する。
→自身の端末にPDFファイルを編集するソフトがインストールされていない場合もある。

他にもたくさん方法はあると思うけど。それじゃあ、PDFファイルに記載されている英語の文章を全て「htmlファイル」に出力して『Google Chrome』で日本語に自動翻訳して読んでしまおう!ということで、PDFファイルの文章を全てhtmlファイルに出力する .NETC#)アプリケーションを作ってみた。

基本的にはハードルを低くしておくものだ。一般的にハードルの高い英語の技術書を恐れることは無い。電子書籍、万歳!。無料のPDFファイルの技術書(英語)を探す道をそのまま進めばいい。

以下はイメージ。
.NETアプリよりもGoogle Chrome推している感じになってしまったが、どんまい。
f:id:masawan-guitar:20170506223855p:plain

(例)日本語に翻訳してみた書籍『Elasticsearch: The Definitive Guide (英語)』
  (PDFファイルサイズ約6 MB、全709ページ)

出力されたhtmlファイル。たっぷり出力。
ひとまずは、PDFの1ページにつきhtmlファイル1つで(実験)。

Internet Explorerにて確認。英語が表示されている。

Internet Explorerの画面

次に、Google Chromeにて確認。日本語への自動翻訳はGoogle Chromeにお任せで。ページをまたいでいる文章のところは明らかに上手くいっていなかったけど、雰囲気で読める日本語。でも、出力処理に改善の余地はある。日本語に翻訳された文章を読んでみると、こんなこといっちゃアレだけど、流し読みして問題ない箇所もけっこう多いものだよね。

PC版(Windows版) Google Chromeの画面

追記 2017/5/15
PC版(Windows版)のGoogle Chromeでは
上の画像のとおり、日本語訳が繰り返し複数表示されてしまう現象が発生していた。
iPad版のGoogle Chromeでは、そのような現象は無く、正常に翻訳されている。
個人的にはたいして問題視するようなことではないのですが。
一応は、PC版Chromeの翻訳機能が改善されるのを待つ。

iPadGoogle Chromeの画面

広告を非表示にする