革新的なソフトウェアで経営課題の解決へ―アシストマイクロ株式会社
AssistMicro

オフィシャルブログ

  • 電子化ラボ
  • 電子化サービス
2013-01-31

【電子化ラボ】紙の情報をデータベースのように活用する方法

こんにちは、1月ももうわずかとなりましたがASSISTMICRO Blog、2013年初のポストとなります。
今年もいろいろなコンテンツをお届けしたいと思いますので、どうぞよろしくお願いいたします。

さて、今回の電子化ラボは“紙の情報をデータベースへ”というテーマでお話しします。

私達アシストマイクロでは、ソリューションのひとつとして、企業や組織の皆様が保有している情報資産(Enterprise Contents)のよりよい運用・管理を目的とした電子化サービスをご提供しています。
(* 紙資料の内容をデジタルデータ化されたいとお考えの方は、よろしければこちらもご参照ください)

電子化を実施されるお客様の課題はケースバイケースですが、そのなかのひとつに、

「紙文書などに記録されている情報を、データベースのように活用したい」

というご要望があります。

“データベース”というと何だか複雑そうな印象がありますが、紙をはじめとしたアナログ媒体に記載されている内容を必要に応じてすばやく抽出できるようにして、業務に応じた参照や分析などを行えるようにする、いわゆる“データ(情報)”としてさらなる活用を可能にすること、とイメージしてもらえればと良いかと思います。

活用したい情報が紙などのアナログ媒体でしか存在していない場合、それをデータベースのように使用するためには、何らかの方法でデジタル化を行うことが必要となります。アナログ媒体のままでは、いかにキャビネットやファイリングといった物理的な手法で整然と管理し、細やかに索引をつけたとしても、必要な情報を瞬時に探すことや横断的に情報を見るといった活用は難しいためです。

では、このような紙の情報をデータベース化する方法には、どのようなものがあるでしょうか。
お客様の例も交えながら、ご紹介していきます。

適切なインデックスデータをつけてデジタル化

紙文書をデータベースとして使用する場合、その資料に対して「記載情報の電子化」「インデックスデータの作成」を行います。

まず、記載情報の電子化では、スキャニングによる資料外観の画像データ化(電子化文書)、OCR変換や手入力による文章等のコードデータ化(電子文書)といった作業を実施します。紙文書に記載されている内容をすべてコードデータにできれば幅広い活用が可能になりますが、その内容を完全に間違いなくコードデータ化するにはかなりの作業が必要です。そのほかの方法にも、それぞれ次のような一長一短があります。

  • 紙文書の内容をすべてコードデータとして入力する
    …幅広い利用が可能になるが、作業コストがかかる。
    (データ作成作業だけでなく、誤情報がないデータにするための校正等も必要)
  • 紙文書にOCRをかけて自動的にコードデータを作成する
    …自動的にアナログ情報からコードデータを作成でき、テキストファイルなどの電子文書とすることや画像データに付与することが可能だが、OCRのみでは誤変換などの可能性があるため精度100%の保証はない。
  • 紙文書をスキャニングして画像データ化する
    …アナログ媒体と同様の見た目をデジタルデータで閲覧できるが、画像なのでそのままでは内容の検索はできない。

そこで、重要になるのが「インデックスデータの作成」です。
インデックスデータとは索引情報のことで、データベースにする際に検索キーとして使用したい情報などを、データ入力で確実に作成していきます。このインデックスデータと記載情報の電子化データをあわせることで、必要な情報を任意に抽出・活用できるデータベースとなります。


icon-smileそのままでは内容検索できない画像データはもちろんだけど、全文検索が可能なコードデータにとってもインデックスデータは大切なんだ。たとえばその文書の「カテゴリ」みたいな情報は、本文中に含まれていない場合があるでしょ?データベースとして使いたい情報は、ちゃんとインデックスデータにすることが大事だね。

blog_db1

実際にお客様が利用されている一例では、次のようなものがあります。

  • 自社で長年発行してきた広報誌や業界誌を電子化(画像データ化)
    …号数や発行年、目次、記事タイトル、著者名などをインデックスとして設定、弊社のインデックスファイル(Excel)で検索・参照。過去の取組みや製品情報などをナレッジとして活用。
  • 自社が保有している紙の商品パンフレットを電子化(画像データ化+OCR処理)
    …製品名や発売日、価格情報などをインデックスとして設定し、自社の情報システムへ登録。顧客への情報提供サービスを円滑に実施。

icon-smile2自分たちが作った発行物でも、古いものはデジタルデータがなかったり、印刷会社にしかデータがなかったり、いろんな事情で紙媒体しかない場合があるんだよ。 ちなみに、データベースの“入れ物”は、お客様が用意してくれた情報システムがあるときはそれに合わせてデータを作るよ!ほかには、ぼくたちが持ってる検索システム簡易検索ツールのご案内もできます✿

情報の発生時からデジタルベースへ

さて、先述のとおり、紙文書の情報をデータベースにするためには一定の電子化作業が発生します。すでに紙で存在している情報は、上記のような対応のなかから、対象となる資料や利用目的に応じてバランスの良い方法を検討することになりますが、これから新たに発生してくる紙の情報はなるべく減らしたいものです。

そこで、別のアプローチとして、“文書の発生時からデジタルベースにする”という方法が考えられます。

データベースとして情報活用したいと考えている紙文書のなかに、申請や報告といった情報のやりとりをしているものはないでしょうか。紙媒体に記載されている“情報”が重要で、紙現物は特に不要というものでしたら、デジタルベースでの運用・管理に切り替えることが可能です。

たとえば自社製品に関する不具合の報告書を紙の書式で運用しているとします。
報告書のながれとしては、

  1. 顧客から不具合の連絡を受けたときに起票
  2. 対応を実施
  3. 結果を記入して報告
  4. 記録として書式を保管

といった感じでしょうか。自社製品の不具合に関する記録でしたら、発生件数や事象の傾向把握、改善案の検討のなど、さまざまな視点から活用できそうな情報ですが、紙のまま保管されていては、同じような不具合が発生したときに過去の事例を参照する程度の利用に止まりそうです。

では、これを紙の書式ではなくデジタルベースの書式(フォーム)に切り替えたらどうでしょうか?

顧客からの不具合の連絡を登録し、対応を行い、結果を記入して報告、という一連のながれで生まれる情報がその都度データとして登録され、蓄積されていく記録がデータベースになっていきます。

blog_flow1
デジタルベース化されれば、たとえば、「どの製品のどの部分で不具合が多いのか」「原因の内訳はどんな状態か」「発生件数の前月比や前年比はどうか」といった多方面からの分析もできるようになり、製品や業務体制の改善策につなげることが可能になります。不具合の起きた製品の写真などがある場合も、デジタルカメラで画像データを撮って報告に添付しておけば、いつでもすぐに参照できるでしょう。
また、発生時点から報告完了までのながれも管理されるので、対応状況の把握や遅延防止などの効果が期待できます。

icon-normalこういうデジタルベースの情報管理には、いわゆる「ワークフローツール」とか「BPM(業務プロセス管理)製品」といったITソリューションの利用が考えられるよ。紙ベースでしていたお仕事をデジタルベースにする、言ってみれば“業務の電子化”って感じかな?

blog_eForm1

 

さて、この方法の場合、デジタルベースに切り替えた時点の前後で情報源は紙とデジタルデータに分かれます。紙媒体のデータについては、下記のような対応が考えられます。

  • 同様にデジタルデータとして登録する
    …同じように登録することで、情報が一元的に管理され、効果的な利活用ができる
    (ただし、蓄積しているものをすべて登録するにはデータ入力等の作業コストがかかる)
  • 必要なインデックスデータと紙文書の画像データをあわせて登録する
    …データベースとして使用するのに必要な情報だけデータとして作成し、詳細な情報は画像データを参照する(なるべく同じ環境から画像データを参照できるようにすると利用が楽)
  • 必要なインデックスデータのみデータとして登録、詳細は現物を参照する
    …データベースとして使用するのに必要な情報だけデータとして作成し、詳細な情報は紙の書式現物を参照する(現物の所在情報が確認できるようにすると利用が楽)

紙で保有している過去の情報については、その量に応じて電子化や登録にかかるコストが比例することから、技術的に一元管理することは可能でもコスト面でのハードルは高いといえるでしょう。この場合は、情報としての使用価値が高い範囲(参照頻度の高い直近分など)のみ電子化して共に活用する、インデックス情報だけデータ化して管理する、といった費用と効果のバランスがとれるポイントを検討するのが現実的です。


icon-star今回の例だと「不具合の報告データはこれだけを見ればOK!」って情報源をひとつにするのが理想的だけど、全部デジタルにするのはなかなか大変かもしれないね。過去のものはそのまま紙の書式で保管して、「○○年より前は紙を見てね」って割り切っちゃってもいいのかも?

まとめ

今回は、紙などのアナログ媒体の情報をデータベースとして活用するための方法をご紹介しました。

「紙文書などに記載されている情報を、データベースのように活用したい」というご要望には、“既存の情報を自由に参照や分析することで、現在、そして将来の業務に活かしたい”、といった本質的な目的があります。電子化はその目的をかなえるための手段のひとつではありますが、データベースとしての利用にかなう仕様で行うことで、キャビネットやファイルなどに置かれて物理的に閲覧するだけだった情報資産を広く活用することが可能になります。

一方で、これから発生する紙文書については、ワークフローやBPM製品などを利用して、初めからデジタルデータとして運用・管理していく方が、そのまま情報を活用できるため利便性が高く、業務効率もよいと言えます。

(実は、社内の取り組みの一環としてBPM製品による各種業務のデジタルベース化を進めているのですが、紙書類の減少、進捗のリアルタイムな把握、情報の参照しやすさ、といったいろいろな効果を体感しております…)

もちろん、取引先や顧客から受け取る形式が紙であったり、法律で紙による保存が義務づけられている文書があったり、すべての紙文書に適用できるわけではありません。(*)

それでも、デジタルベースで運用できるものはデジタルにしていくことが、自分たちの情報資産を管理・活用していくうえでも重要であると感じます。

皆様のオフィスにも、眠ったまま活用の機会を待っている情報資産があるのではないでしょうか。
ぜひ、周囲を見てみてください。

(*)紙自体を無くすことはできなくても、情報活用を主目的とすれば、紙の発生時に必要な情報をデータ化して運用し、紙現物はしっかり保管しておく、という手はありますね。

by choji