制作業務支援システム
制作業務支援システム

移行支援システム

ファイル管理&校正変換システム

特定のファイル管理システムをターゲットとした移行業務の管理負荷低減を目的に、ファイル管理システムの機能を可能な限りホンモノに近づけて開発したシステムです。
開発当時、移行期間の短縮という課題があり、そのためには実作業の負荷分散と管理負荷の低減との両立を実現する必要があるとのことで、データ管理そのものの人的負荷をゼロに近づけることを目指して開発しました。
このシステムでは、次のような機能を実装することにより、課題の解決を実現しています。
ファイル管理機能
ターゲットシステムとほぼ同等のファイル属性情報をデータベースに置き、データベースと実ファイルとをこのシステムが紐づけることによって、ファイル管理機能を実現。
データベースは、MS Access® のmdbファイルを使用。
ファイル変換機能
ターゲットシステムは変換処理によって、ソースデータから閲覧データを生成する機能を持っており、校正には変換後の閲覧データを使用する必要がありました。
ターゲットシステムとほぼ同等の変換機能を搭載し、その操作をより簡単な実装とすることによって、ソースデータと閲覧データとの不一致リスクの回避を実現。
ファイル出力機能
導入前までは、ファイルの一覧となるExcelファイルを手作業で作成しており、オペレーションミスなどによって一覧と実ファイルとが紐づかないことがしばしば発生しておりました。
データベースから一覧を作成し、実ファイルを出力フォルダへコピーする機能を搭載することで、オペレーションミスゼロを実現。
また同時に、一覧にソースデータや閲覧データのファイルサイズを出力することで、ファイルの肥大化による表示時間の増大といった移行後の課題の早期顕在化をも実現。
オペレーションに適したGUI
せっかくの機能も使ってもらえなければ本末転倒ですから、使い勝手にもとことんこだわりました。
目次ツリー表示や、目次ツリーをダブルクリックするだけで作成元のアプリケーションが開くなど、直感的な動作が可能なGUIを実現しました。
作業区分単位での一括変換や、校正プリント用のPDF結合などの機能面も追及することで、システムを使わずにオペレーションが実行されることのないよう、細部までこだわりました。

書誌情報入力支援システム

論文や特許情報などの公開システムへ登載するには、書誌情報と呼ばれる情報を作成して本文データ(PDFデータなど)とともに登録する必要がありました。
書誌情報はテキストファイルに専用のタグ(XMLではない)を書き込んで記述する方法が当時は一般的であり、厳密なシステムであれば空行さえも一定の意味を成す場合もありました。
テキストファイルはWindows標準の「メモ帳」(notepad.exe)などでも簡単に作成できる反面、タグの記述ミスや空行の過不足等により、登録する段階になってトラブルに見舞われることもしばしば発生しておりました。
当初、Excelに項目を入力してテキストファイルへ書き出す方法も考えましたが、著者情報や引用文献情報が複数の場合もあり、また、これらには上限がないことから、Excelの活用を断念し、データベースの活用という方法で実現いたしました。
冊子情報を含む書誌情報管理機能
巻、号、表題、著者、引用文献などの情報をデータベースに置き、GUIを通じてこれらを入力、修正する機能を実装。
また、本文データの実体ファイルとの紐づけも実装することで、書誌情報および本文データの一元管理を実現。
データベースは、MS Access® のmdbファイルを使用。
全半角および文字コード検査機能
英語用フィールドには半角文字を、日本語用フィールドにはJIS X 0208(環境依存文字を除く)に規定された文字をそれぞれ入力するルールがあり、これらのルールに適応していることを検査する機能を実装。
この検査機能を校正工程の前に実行することで、校正作業負荷と目検依存度の低減を実現。
本文データ検査機能
例えばPDFデータには、タイトルや著者等の属性情報を設定できますが、属性情報にも入力ルールが設けられていることも多く、これらのルールに適応していることを検査する機能を実装。
属性情報は紙面校正が困難であり、ミスがそのまま流出するリスクを伴います。
入力した書誌情報のいくつかのフィールドを組み合わせて入力するルールであることから、最終段階で属性情報を入力してこの検査機能を実行することで、ミスの流出防止を実現。
登載データ出力機能
データベースにて管理していた書誌情報を、専用タグで記述されたテキストファイルへ出力し、併せて本文データをコピーして集める機能を実装。
このシステム本来の目的であるタグの記述ミスや空行の過不足等を根本から排除することを実現し、登載時におけるトラブルの低減を実現。

作業支援ツール

OCR支援ツール

OCRは、紙や画像から高速で文字データを生成する優れたソリューションですが、誤認識の補正や特定のコード範囲(JIS X 0208など)内への適応は、人手に頼らざるを得ないのが実情です。
近年は電子化が進み、OCRをかける場面そのものが減少してきていることや、新興国台頭による価格破壊に直面したことから、国内で新たに熟練の技術者を育てる風潮も後退していることもあり、品質の維持に頭を悩ませている経営者さんも多いことでしょう。
OCR作業に熟練の技術者が必要な理由は、次の2つが挙げられます。
手入力では想定しえない誤認識等がOCRでは生じうることから、OCRの誤認識等の傾向を把握している必要があること。
文字ひとつひとつをコード辞書で確認するには時間がかかり過ぎることから、特定のコード範囲(JIS X 0208など)外の文字をある程度識別しうる知識と経験値が必要であること。
逆をいえば、この2つを別の方法で実現することができるなら、熟練の技術者は必ずしも必要ではないということになります。
次のような機能を実装することにより、課題の解決を実現しています。
文字パターン置換機能
定義ファイルに定義された複数の置換パターンに基づいて、文字パターンに合致する文字または文字列を置換する機能。
文字パターンとして、正規表現も扱える実装としたことで、行頭の特定文字や、可変部分を持つ文字列を置換することも可能(可変部分を維持したまま置換することにも対応)。
特定のコード範囲(JIS X 0208など)外の文字を予めコード内の文字へ置換しておくことにより、コード範囲対応の作業負荷の低減を実現。
文字パターン検出機能
定義ファイルに定義された複数の検出パターンに基づいて、文字パターンに合致する文字または文字列を検出する機能。
文字パターンとして、正規表現も扱える実装としたことで、行頭の特定文字や、可変部分を持つ文字列を検出することも可能。
誤認識されるパターンが複数生じる画数の多い文字を、OCRソフト側で“〓”などの特殊な文字に設定しておくことで、誤認識箇所の機械的な特定をも実現。
全半角および文字コード検査機能
OCR作業仕様に規定された全半角や特定のコード範囲(JIS X 0208など)への対応状況を検査する機能を実装。
この検査機能を校正工程の前に実行することで、校正作業負荷と目検依存度の低減を実現。

入稿データ把握関連ツール

近年は電子化が進み、原稿をデータで受領する割合が著しく高くなりました。
ヒトは不思議なもので、冊子のように実体のあるものを把握するのは得意ですが、データファイルなどの開いて眺めていても実体が掴みにくい存在を把握するのはあまり得意ではないようです。
とはいえ、全体像の把握が進まないことには、この先の計画(特に時間管理)が成り立たないことから、次に挙げるようなツールを作成しております。
ファイル一覧作成ツール
指定したフォルダ配下のすべてのファイルを読み込み、ファイルのフルパス、パス(フルパスからファイル名を除外)、ファイル名、純粋ファイル名(拡張子を除外)、拡張子、最終更新日時、ファイルサイズ、そして、チェックサムを記載した一覧表(CSVデータ)を生成するツール。
入稿したファイル数の把握や、チェックサム比較による同一ファイルの特定、拡張子等による一時ファイルの特定など、スピーディな入稿データファイル全体像の把握を実現。
ページカウントツール
指定したフォルダ配下のすべてのWordファイルおよびPDFファイルを読み込み、ファイルのフルパス、拡張子、そして、ページ数を記載した一覧表(CSVデータ)を生成するツール。
Office 2007以降がインストールされていれば、Excelのページカウントも可能(ただし、Excelのページ設定によっては著しく誤差が生じることもある)。
入稿したページ数や、データ形式別のページ数など、スピーディな入稿データボリュームの集計を実現。
Wordデータ解析ツール
指定したフォルダ配下のすべてのWordファイルを読み込み、プロパティ設定値、ページ数、段落数、文字数、オブジェクトの数、ハイパーリンクの数、フィールドコードの数、そして、目次設定の有無などを記載した一覧表(CSVデータ)を生成するツール。
入稿時チェックの優先順位を決める判断材料を得ることにより、効率的で効果的な入稿時チェックを実現。
それぞれのツールが持つ機能を組み替えて、業務や入稿データ形式に応じた専用ツールを作成することも承っております。
Copyright © GAIDE CO., LTD. All rights reserved.