特定非営利活動法人 サイエンス・アクセシビリティ・ネット
数式認識ソフトウェア
|
|||||||||
|
■InftyReaderとは
InftyReaderは、九州大学大学院数理学研究院鈴木昌和研究室を中心に多くの人の協力により開発された、数式を含む文書認識ソフトです。 InftyReader は数式、文字、画像が混在する文書を、スキャンした画像を認識します。 日英混在文の認識にも威力を発揮します。 1行中に日本語と英語(欧文)の部分が混在していても高精度な認識結果が得られます。 数式を含む文書のスキャン画像を OCR を用いて認識し、結果を確認・編集後、XMLファイル、LaTeXのソースファイルの形式やHTML, Texから数式記号などを除いた Human Readable TeX などの形式でファイルに保存することが出来ます。 InftyReader で認識した結果は直接 LaTeX 形式や HTML(数式部はMathML)形式で出力することも出来ますし、数学用文書エディタ InftyEditor で原画像と照合しながら修正・編集した後に LaTeX, HTML(MathML), PDF などの形式に変換することもできます。 ■ダウンロードInftyReader Ver.2.7.3 (2008年8月12日版)【 Windows版のみ】
科学技術文書用OCRソフトウェア InftyReader の最新版を下記よりダウンロードすることができます。
この InftyReader Ver.2.7 シリーズのセットアッププログラムには、文字認識辞書が含まれていません。インターネットでのダウンロードの負荷を軽減するため、認識辞書は InftyReaderDicKitA, InftyReaderDicKitB という2つのパッケージに分けてあります。日本語版も英語版も認識辞書は共通で、どちらの場合も DicKitA, DicKitB の両方の認識辞書をインストールする必要があります。InftyReader Ver.2.7 の認識辞書は Ver.2.6 シリーズの認識辞書と共通ですので、既にお持ちの場合は辞書の更新の必要はありません。 試用期間に関する変更 これまでは試用期間を最初に使った日からの経過日数で制限していたため、一度テストしてからライセンスを購入せずに1ヶ月以上経ってしまうと、新しいバージョンのソフトをインストールしても試してみることが出来ませんでした。バージョン 2.6.5 からは試用日数を実際に使った日でカウントし、全く使わなかった日は含めない方法に変わりました。従って、例えば月に2回程度しか使わなければ数ヶ月間試用することができます。 (注意:ユーザー登録後の購入ライセンスキー登録までの試用期間延長は経過日数で30日のままで変更はありません。) 評価テスト専用版について 評価テスト専用版はあくまで評価テスト用であり、一度に複数ページ認識することは出来ません。また、1日に認識処理できるのは5ページまでに制限されています。その他には機能制限はありません。尚、評価テスト専用版は予告無しにリリースを中止する場合がありますので、ご了解下さい。 インストールについて3つのパッケージに含まれているセットアッププログラム InftyReaderJ27_Setup.exe を実行すると InftyReader の全体がインストールされます。セットアップの順序はどの順番でも構いませんが、セットアップ先のフォルダは必ず同じにしてください。(既に Ver.2.6 シリーズの辞書キット A, B がインストールされている場合は、更新の必要はありません。InftyReaderJ27_Setup.exe のみを実行すれば十分です。) ■注意事項InftyReader は鮮明に印刷されたページ画像の白黒2値による600DPI(又は400DPI)によるスキャン画像を認識対象とします。(*) スキャニングした画像は TIFF か GIF または PNG の形式で保存する必要があります。また、PDF ファイルを読み取り、InftyEditor のデータ形式や LaTeX や MathMLなど、編集可能な形式に変換することも出来ます。 InftyReader Ver.2.6 のいくつかの特徴をあげると
InftyReader は前処理で或る程度のノイズ除去を実行し、ページ画像を図領域、表領域、テキスト領域(数式を含む)に自動的に分割します。
その上でテキスト領域を認識し、数式は構造解析を行います。そして、表の中はセル毎に認識します。 InftyEditor のバージョンが 2.5.0 以後のものであれば、認識した表の編集も出来ます。 (*) 注意 認識対象とするスキャン画像の品質の目安として、スキャンした画像中の接触文字や切れ文字などの数が、1頁中の総 文字数の1%以内になるようにスキャナの2値化レベルを調節して下さい。 印刷と紙の質に問題がなければ、通常はこの水準のスキャン画像が得られると思います。(勿論、それでも誤認識は発生します。) ■使い方の例 1. InftyReader を起動した画面で、画像ファイル又はフォルダを選びます。 すると、ファイルを選んだ場合はそのファイルの認識結果が、フォルダを選んだ 場合はそのフォルダ内の全ての画像ファイルの認識結果が指定した出力ファイル名 のファイルにまとめて書き込まれます。
出力ファイルのタイプが "IML" であれば "subfolder1.iml" と "subfolder2.iml" が "foldertop" フォルダ内にできます。そして、画像ファイル a.tif と b.tif の認識結果が subfolder1.iml に、c.tif と d.tif の認識結果がsubfolder2.iml に書き込まれます。 【InftyEditorを使っての操作】InftyEditor から直接 InftyReader を呼び出して認識を実行することもかのうです.(Ver.2.04x 以後の InftyEditor をインストールしていただく必要があります。) こちらの操作方法については、InftyEditor専用ページを参考にして下さい。 ■ライセンスこの InftyReader Ver.2.6.5 は製品版です。インストール後、延べ15日間は何ら機能制限なしに無償にて利用可能ですが、それ以上継続して利用するためにはライセンスキーを購入する必要があります。ライセンスキーを購入方法については購入サイトをご覧下さい。 (試用期間には全く使わなかった日は含めません。従って、例えば月に3日程度しか使わなければ数ヶ月にわたって試用することも可能です。) ユーザーは試用期間中に本ソフトウェアを利用し、動作を十分確認した上で本ソフトウェアの購入手続きを行ってください。如何なる理由があっても、一旦受け取ったライセンスキーの返品は受け付けられませんのでご注意下さい。 InftyReader のライセンスは1つのライセンスで同じユーザーが2台のパソコンまで登録して利用することが出来ます。但し、このライセンスは個人の利用目的のために使用する場合を対象とします。所属機関等によって特定個人の利用の為 に購入された場合もそれに含めます。会社・団体等の組織が多数の利用者のため にサービスする場合や、業務上大量のデータを電子化する場合は、下記の連絡先 (特定非営利活動法人サイエンス・アクセシビリティ・ネット)にご相談下さい。 少人数のグループで共同利用する場合や、小さな福祉団体等が少人数の利用者の ためにサービスする場合などは、原則として個人利用と同等と見なします。 本ソフトウェアに含まれている、株式会社東芝製のライブラリーや、株式会社 メディアドライブ製のライブラリーを本ソフトウェアと切り離して利用したり 配布したりすることを禁止します。 本ソフトウエアまたはその生成物を上記著作権者の許可なく複製して販売する ことを禁止します。また、上記著作権者の許可なく本ソフトウエアーを改変して 配布することを禁じます。無償での複製の配布は圧縮された元のパッケージの形 で行う場合に限り許可します。本ソフトウェアのリバースエンジニアリング、 逆コンパイル、あるいは逆アセンブルも禁止します。 InftyEditorの著作権はInftyProject, Science Accessibility Net及び株式会社 CAIシステムが保持しています。 株式会社東芝、株式会社メディアドライブ及び上記著作権者は、本ソフトウエア の誤りの修正、その他いかなる保守についても義務を負わず、また、本ソフト ウエアの使用、複製ならびに頒布により生じた損害または第三者からの請求に ついては、法律上の根拠を問わず一切責任を負いません。 問い合わせ先:
本プログラムに関するお問い合わせは下記までお願いします。 特定非営利活動法人 |
||||||||
| ▲TOP |