ブラウザだけでPDFからテキストを抽出

【東京IT新聞meets百式】

2008年02月05日(火)

[ 70 号]

PDFTextOnline(http://www.pdftextonline.com/)より

PDFTextOnline(http://www.pdftextonline.com/)より


ブラウザだけでPDFからテキストを抽出してくれる『PDFTextOnline』

 ちょっと知っておくと便利かもしれないツールのご紹介。
 PDFTextOnlineはブラウザ上でPDFファイルからテキストを抽出してくれるツールだ。
 Acrobat Readerが手元にないときや、PDFは重いからテキストにしたいなぁ、というときに便利かもしれない(使いどころが難しいが)。
 英語版のサービスではあるが、日本語のテキストもちゃんと抽出してくれる。またブックマークが文書中に含まれていたら、その情報まで抜き出してくれる。
 なんにせよ、ブラウザだけで、という手軽さが良い。ブラウザさえあればあとはなんとかなる、という時代に近づいているようですな。(百式より)

百式(http://www.100shiki.com/)

百式(http://www.100shiki.com/)


 今回は「これこそSaaS」というサンプルのようなサイト。手持ちのPDFファイルをアップロードすると、その中のテキストデータを抽出してくれてダウンロードできる。PDFは表示がきれいだが、容量が大きく表示に時間がかかるので、急いでいる時やメールに添付するのに支障が出ることがある。そんな時にちょっと行って気軽にテキストファイル化することができる。

 以前はこんな時、「PDFファイルのテキストデータを取り出すソフト」をベクターなどダウンロードサイトで探してそれをダウンロードしてインストールする、なんてことをしていたが、それがブラウザだけでできるようになったのだ。オラクルやオライリーなどが提唱する「低価格パソコン」はこの発想の延長線上にある。いわば現代版「ダム端末」である。

 昔のダム端末はちょこんとネットワーク端末ソフトが載るだけの粗末なものであったが、この現代版はブラウザを中心にプラグインとして動画再生などの機能が附属する高機能のものだ。これが「100ドル」「200ドル」で提供でき、かつSaaSサイトがもっと普及すれば、いわゆる「デジタルデバイド」の問題の解決にも役立つ。実際、途上国で食料以外の援助物資として配布されるパソコンはこのようなタイプのものである。先進国でも近年貧富の差が拡がって問題になっているが、このくらいの価格であれば、国家予算で貧困家庭にパソコンを支給することもできそうである。

 オラクルやオライリーの言うようにすべてがこのような低価格パソコン+SaaSサーバでまかなえるとは思わないが、二極分化の一極をなすことは間違いないだろう。このモデルの成否は、ひとえにどれだけ使いやすく高機能なSaaSサイトが出てくるかにかかっている。また、単独のサイトで高機能化を目指す以外に、サーバ同士をユーザが組み合わせて使うことができるインターフェイスもあるといいかもしれない。UNIXの「パイプ」の発想である。これからどのようなものが出てくるか期待したい。
( 城崎裕一 )

キーワード

関連リンク


記事についてのご意見・ご感想

東京IT新聞 特集ラインナップ

専用サーバ・専用レンタルサーバーは at+link におまかせ!

Apple Store(Japan)

東京IT新聞HOTキーワード
東京ITイベント情報

イベントカレンダーを見る カレンダーを見る