----------------------------------------------------------------------- ソフトウェアの概要、インストール、動作環境、使用権許諾条項 (必ずお読みください) ----------------------------------------------------------------------- InftyReader Japanese Edition, Version 3.3 (C) Copyright 2000-2021: Masakazu Suzuki (Kyushu Universirty), InftyProject (http://www.inftyproject.org/), Science Accessibility Net (http://www.sciaccess.net/). ----------------------------------------------------------------------- 目次 1.パッケージについて 2.ソフトウェアーの概要 3.動作環境 4.使い方 5.ライセンス 6.問い合わせ ----------------------------------------------------------------------- 1.パッケージについて これは InftyReader Ver.3.3 のセットアップパッケージです。  InftyReaderJ33xx_Setup.exe を実行すると InftyReader と認識辞書が一緒にインストールされます。 2.ソフトウェアーの概要 本ソフトウェアーはOCR(光学文字認識)を用いて、数式を含む科学技術文書 のスキャン画像を認識し、LaTeX や HTML, XMLなどの再利用可能なデータに変換 するソフトウェアです。 九州大学大学院数理学研究院鈴木昌和研究室を中心に多くの人の協力により 開発されたもので、テキスト部分(日本語・英語)の認識には株式会社東芝製の 認識エンジンと株式会社メディアドライブ製の認識エンジンを互いに他の誤認識 を補正しあうように併用して高精度の認識結果を得られるように工夫されています。 本ソフトウェアーでは、鮮明に印刷されたページ画像の600DPI又は400DPIによる スキャン画像を認識対象とします。スキャニングした画像はTIF か PNG または GIF の形式で保存する必要があります。 InftyReader では、できる限り、「600DPI」での「白黒2値」のスキャニングを おすすめします。 InftyReaderからPDFファイルを直接開いて認識することも出来ます。InftyReader は前処理でxpdfを用いてPDFをPNGファイルに変換してから認識を実行します。 InftyReader は前処理で或る程度のノイズ除去を実行し、ページ画像を図領域、 表領域、テキスト領域(数式を含む)に自動的に分割します。その上でテキスト 領域を認識し、数式は構造解析を行います。しかし、より正確な認識結果を得る 為には、スキャンした画像中に図、表やノイズがある場合は事前にそれらを除去 してから認識にかけるようにして下さい。認識対象とするスキャン画像の品質の 目安として、スキャンした画像中の接触文字や切れ文字などの数が、1頁中の総 文字数の1%以内になるようにスキャナの2値化レベルを調節して下さい。印刷 と紙の質に問題がなければ、通常はこの水準のスキャン画像が得られると思いま す。(勿論、それでも誤認識は発生します。) InftyReader の出力フォーマットは IML, XHTML, LaTeX, HR-TeX などとなって います。 IML は数学用文書エディタInftyEditor(http://sciaccess.net/jp/InftyEditor/) の標準フォーマットです。InftyReader の認識結果を InftyEditor で開くと、 原画像と照合しながら認識結果を修正することができ、その編集結果を LaTeX や MathML, HR-TeX, PDF などのフォーマットに変換することが出来ます。 XHTML 形式では数式部は MathML で出力されます。 HR-TeX は視覚障害者が読んで理解できるように単純化された LaTeX-like な表記法 で、LaTeX などのコンパイラには通りませんのでご注意下さい。 3.動作環境 InftyReader は Microsoft 社の Windows 8.1, 10上で動作します。 4.使い方  1. InftyReader を起動した画面で、画像ファイル又はフォルダを選びます。  2.出力ファイルのタイプ (IML, LaTeX, XHTML など)を選択し、入力画像の    言語等などの設定を選んでチェックをいれます。 3. 出力ファイル名を入力します。 4. 認識開始ボタンを押します。 すると、ファイルを選んだ場合はそのファイルの認識結果が、フォルダを選んだ 場合はそのフォルダ内の全ての画像ファイルの認識結果が指定した出力ファイル名 のファイルにまとめて書き込まれます。 フォルダを選んだ場合で、「オプション」で「選択したフォルダ以下のサブフォルダ も認識対象にする」にチェックを入れた場合、各サブフォルダ内の画像の認識結果が サブフォルダ名に tex, iml, xhtml の拡張子を付けたファイルに出力されます。 例えば、下記のようなフォルダ構造をもつフォルダ "folodertop" を入力画像フォル ダ名として選んだ場合、 foldertop |-- subfolder1 | |-- a.tif | |-- b.tif | |-- subfolder2 |-- c.tif |-- d.tif 出力ファイルのタイプが "IML" であれば "subfolder1.iml" と "subfolder2.iml" が "foldertop" フォルダ内にできます。そして、画像ファイル a.tif と b.tif の認識結果が subfolder1.iml に、c.tif と d.tif の認識結果がsubfolder2.iml に書き込まれます。 5.ライセンス InftyReader を利用するためにはライセンスキーが必要です。 サクセスネットのサイトからシリアル番号を購入して下さい。InftyReader は 1つのシリアル番号で1台のパソコンにライセンス登録して利用することが出来ます。 詳しくはサクセスネットのホームページをご覧下さい: http://www.sciaccess.net/jp/InftyReader/ ユーザー登録前は初期画面で「試用/閉じる」ボタンをクリックすると、試用モード で実行することが出来ます。試用モードでは1日に認識処理出来るページ数に制限が ありますが、それ以外の動作は正規のライセンス登録後と全く同じです。 ユーザーの方々は試用モードで本ソフトウェアを利用し、動作を十分確認した上で 本ソフトウェアの購入手続きを行ってください。如何なる理由があっても、一旦 受け取ったシリアル番号の返品は受け付けられませんので、ご注意下さい。 このライセンスは個人の利用目的のために使用する場合を対象とします。 所属機関等によって特定個人の利用の為に購入された場合もそれに含めます。 また、少人数のグループで共同利用する場合や、小さな福祉団体等が少人数の 利用者のためにサービスする場合などは、原則として個人利用と同等と見なします。 個人利用を原則とするため、初期設定では、1つのライセンスで1ヶ月間に 認識処理できる頁数は最大10000頁に制限されています。 会社・団体等の組織が多数の利用者のためにサービスする場合や、業務上大量の データを電子化する場合は、下記の連絡先(特定非営利活動法人サイエンス・ アクセシビリティ・ネット)にご相談下さい。 本ソフトウェアに含まれている、株式会社東芝製のライブラリーや、株式会社 メディアドライブ製のライブラリーを本ソフトウェアと切り離して利用したり 配布したりすることを禁止します。 本ソフトウエアまたはその生成物を上記著作権者の許可なく複製して販売する ことを禁止します。また、上記著作権者の許可なく本ソフトウエアーを改変して 配布することを禁じます。無償での複製の配布は圧縮された元のパッケージの形 で行う場合に限り許可します。本ソフトウェアのリバースエンジニアリング、 逆コンパイル、あるいは逆アセンブルも禁止します。 株式会社東芝、株式会社メディアドライブ及び上記著作権者は、本ソフトウエア の誤りの修正、その他いかなる保守についても義務を負わず、また、本ソフト ウエアの使用、複製ならびに頒布により生じた損害または第三者からの請求に ついては、法律上の根拠を問わず一切責任を負いません。 6.問い合わせ先: 本プログラムに関する技術的なお問い合わせは下記までお願いします。 e-mail:support@sciaccess.net その他のお問い合わせは下記の事務局にお問い合わせ下さい。 -------------------------------------- 特定非営利活動法人 サイエンス・アクセシビリティ・ネット e-mail:office@sciaccess.net URL: https://www.sciaccess.net/ --------------------------------------