Word、Excel、PDFファイルのデジタライゼーション

Word、Excel、PDFで作成された帳票は電子データと言ってもそのままでは有効活用することができません。有効活用するためには帳票から必要な項目を抽出しデータ(共通フォーマット)化する必要があります。効率よくデータ化する方法としてデータ整備サービスを利用し、短期間でのデータ化を実現しました。

顧客

  • 業種:製造業
  • 部署:
  • 利用シーン:Word、Excel、PDFファイルのデータ化

背景

様々な産業分野で利用される機器を用いて、お客様から指定された条件のもと、どのような結果が得られるのかテストを行い、テスト報告書を作成しています。
DX推進に伴い、テスト報告書を作成するシステムを導入し、今後はテスト条件やテスト結果をデータとして蓄積することができます。ただ、DX推進に向けデータ活用するためには、Word、Excel、PDFで保管されている過去のテスト報告書数千枚のデータ化が必要となります。
システム導入以前のテスト報告書は、Word、Excelでひな形を作成し標準化をしましたが、時間の経過とともに細部で異なるファイルが作成され標準化が崩れてしまいました。
まずは、OCRを利用したデータ化を検討しましたが、テスト報告書の書式が一つ一つ異なるため断念しました。次に、VBAでデータ化することを検討しましたが、書式が異なる数千枚のテスト報告書をデータ化するには1年以上必要となる見込みになりました。そこで、データ整備サービスを利用することで、約4ヶ月でデータ化することができました。

課題と効果

  • DX推進に向けたデータ活用を行うためには、過去のテスト報告書数千枚のデータ化が必要だが、書式が異なるため単純にはデータ化できない。

    代表的なテスト報告書をどのようにデータ化したいか(テーブル編集仕様)を伝えることで仕様通りのデータを作成してもらえました。

  • データ化するには1年以上の期間が必要となる見込みだが、DX推進にはもっと短期間でのデータ化が望まれる。

    データ整備サービスを利用することで、約4ヶ月でデータ化が完了し、データの有効活用による業務改善ができました。

利用イメージ

数千枚あるテスト報告書のデータ化をデータ整備サービスを利用して行いました。テスト報告書は、いくつかのパターンに大別できるものの細部では書式や記載方法が異なり、パターンごとのプログラムを準備し、細部は個々にプログラム修正をしながらデータ化するには1年以上かかると想定していましたが、データ整備サービスを活用することで約4ヶ月でデータ化を行うことができました。まずは、代表的な数パターンのテスト報告書とテーブル編集仕様を伝え、順次処理していく中で、新たなパターンのテスト報告書が見つかれば、都度テーブル編集仕様を確認するという手法でテスト報告書のデータ化を進めました。

デジタライゼーション

関連動画:デジタライゼーション

概算見積スタート

データレイク

前の記事

データレイク・データドリブン