名寄せ

名寄せとは?

企業が収集し蓄積している情報量は膨大であり、日々増えていきます。日々追加・更新されていく情報をビジネスに最大限活用するためには、データを定期的に整備していく必要があるでしょう。特に、情報が蓄積されていく中で発生する情報の重複・分散は、そのままにしておくと営業効率が落ちるばかりか社会的な信用を失うことにもなりかねません。

そこで必要となる作業が、「名寄せ」です。

ここでは、名寄せの概要や必要性について説明し、名寄せを行う実際のプロセスを紹介していきます。

名寄せとは

名寄せとは

名寄せを一言で説明すると重複を排除することです。つまり顧客を識別する際、名称や名前、住所や電話番号などの属性が同じ顧客をひとまとめに整備することを名寄せと言います。名寄せをすることで、重複排除されたキー(名寄せキー)で集計できるようになり、一元化されたデータで処理や分析を行えます。異なるシステムのデータを統合して処理、分析するためには、必要なときに必要な情報を必要な名寄せキーで重複排除する必要があります。

企業が扱う情報には、同じ人物・企業が重複または分散して存在しているものも多くあります。このままでは抽出時に重複してしまい、同一顧客に同じ手紙・メールを複数出してしまうなどミスが出やすくなるのです。こうした事態を避けるため、名寄せによって同じ属性をもつ顧客の情報を統一、整備します。

<名寄せとして挙げられる例>

  • 複数のデータベースにある同一人物や同一企業などに対し、同一のIDを付与する
  • 同じメールアドレスを保有する顧客情報を一つにまとめる

名寄せはなぜ必要なのか?

名寄せはなぜ必要なのか?

ここからは、名寄せの必要性について、2つ説明していきます。

名寄せをすることで重複したデータを一つにできる

重複したデータをそのままビジネスに用いてしまうと、無駄な営業コストの発生や社会的な信用の低下につながりかねません。

たとえば以下のような問題が発生する可能性があります。

  • 既に断られた顧客に対して、他の担当者が改めて営業アプローチをかけてしまう

こうした失敗は営業コストが無駄にかかるだけでなく、顧客からの信用を大きく失うことにもなります。しかしあらかじめ名寄せを行って重複するデータを統合しておくことで、防ぐことが可能です。

顧客の状態が明確になるので営業効率が上がる

名寄せをすることで顧客の状態が明確になり、営業効率向上が期待できます。顧客情報が様々なデータベースに分散している状態では、一つのデータの参照だけで自社が保有する当該顧客の情報を全て確認することができません。しかし名寄せを行うことで同一企業のデータを一つにまとめることができ、アプローチしたい先の情報を一度で確認できます。たとえば、「株式会社A」という企業のデータを「株式会社A」「A株式会社」「(株)A」など複数の表記で登録していた場合、情報が分散してしまう可能性があります。このままでは株式会社Aへ営業アプローチをかける際に、同一の手紙を複数送ってしまったり重要な情報を見逃すなど営業効率を悪くしてしまいます。

名寄せの5つのプロセスについて

名寄せの5つのプロセスについて

ここでは名寄せのプロセスを5段階に分け、それぞれについて説明していきます。

名寄せの対象項目を確認する

名寄せ項目それぞれに、どんなデータがあるかをすべて確認します。まず名寄せをしたい複数のデータベース内にある情報を調べ、現時点でのデータ記録状況を確認します。状況が確認ができたら、名寄せのゴールとして最終的にどのような形でまとめたいのかを決定します。

<名寄せ対象項目>

個人名寄せ項目候補
氏名、氏名(カナ)、生年月日、電話番号、携帯電話番号、郵便番号、住所、住所コード、カスタマバーコード、Eメール、クレジットカード、口座番号
法人名寄せ項目候補
法人名称、法人名称(カナ)、事業部・支店、氏名、代表電話番号、電話番号、郵便番号、住所、住所コード、カスタマバーコード、Eメール、クレジットカード、口座番号、URL
個人名寄せ+法人名寄せ候補
上記、個人名寄せ・法人名寄せ項目
世帯名寄せ候補(住所が同一でも異なる世帯が存在する)
氏、電話番号、郵便番号、住所コード、カスタマバーコード、クレジットカード、口座番号

顧客データに対象項目を追加する

既存の顧客データに、名寄せ対象項目をすべて追加します。

<名寄せ項目詳細 >

氏名
「姓+名」に分割し、文字のルールを明確にする(例えば、外字の扱い)
カナを持つ場合は、文字の濁点、小文字の扱いを明確にする
電話番号
「市外局番+市内局番+加入者番号」
住所
市区町村以下の文字ルールを明確にする(例えば、3丁目3番地3号 → 3-3-3)
また、国土地理協会(11桁)を利用する場合は「11桁住所コード+住所コード対応以外の住所」に分割する
住所コード
国土地理協会(11桁)、日本行政区画番号(7桁)、JIS市区町村コード(5桁)等がある
カスタマバーコード
郵便を利用する場合は利用するため、名寄せ項目に利用すると便利
法人名称
法人格のルールを明確にする

データ整備(クレンジング)を行う

対象項目の追加が完了したら、データ整備を実施します。同一氏名や同一名称、同一住所などでまとめていくため、データの表記揺れを解消しなければなりません。整備しないままだと、検索等を行った際に同一の顧客だと判別できなくなり、情報の質が悪化してしまいます。あらかじめ統一の表記ルールを定めておき、ルールに従い、データの整備を行っていきましょう。また、住所や苗字など都度変わる可能性がある情報は、最新の情報を確認して揃えておく必要があるでしょう。処理時間が相当かかる(日単位)。パッケージを利用し、氏名、郵便番号、住所コード、カスタマバーコード、を整備(クレンジング)します。ただし、約95%は整備可能だが、残り5%は手作業となります。パッケージのほかに、データクレンジングサービスを実施している会社もあります。

関連記事:データクレンジングに関する記事はこちら

名寄せテーブルの作成を行う

名寄せ項目を選択し、名寄せキーを決定し、名寄せテーブル(名寄せ対象項目で構成)を作成します。世帯で名寄せを行う場合は、別途、世帯名寄せテーブルも作成します。名寄せキーは上記で説明した住所や氏名、電話番号などがあります。住所は変更する可能性があり、氏名は同性同名の方がいれば重複してしまう可能性があります。情報取得の難易度や比較的変わりにくいキーとしてはメールアドレスが挙げられ、名寄せのキー項目として利用されることが多いです。

処理フローの決定をする

名寄せを行う際には、処理フローを決めておくことが大切です。ただし「システム処理+手作業」の時間を考慮する必要があります。初回の処理、日々の運用、月次の運用、新たなデータが追加になったときの運用、新たな項目が追加になったときの運用、名寄せキー変更時の運用します。顧客データは時間と共に変化するため定期的な名寄せ作業が必要であり、初回の処理だけでなくその後の運用方法も決定しておくことが大切です。

名寄せに役立つおすすめのツール「データ整備サービス」

データ整備、レポート

ここでは、日本ソフト開発株式会社が提供する「データ整備サービス」の概要について解説していきます。

データ整備サービスの3つの特徴

データ整備サービスには、3つの大きな特徴があります。

①Cost:明確な見積

テーブル数、データ件数に対応した料金体系で、ご利用いただけます。

②Speed:最短1週間

短期間で、データ確認、データ整備を実施いたします。

③Usability:わかりやすく

データ確認とデータ整備を繰り返すことで、データを情報にします。

データ整備サービスの詳細

データ整備サービスでは「データ確認」と「データ整備」を繰り返し、データ活用の課題解決をお手伝いいたします。

データ整備のStep1 データ確認

CSVファイルとテーブル編集仕様をお預かりし、データ確認レポートを短期間(最短2日)で作成いたします。

テーブル編集仕様の作成をお客様で行うことが難しい場合は、弊社にて作成サポートも行っていますのでご安心ください。

データ整備のStep2 データ整備

いただいたテーブル編集仕様を元に、お預かりしているCSVファイルを整備・加工して、短期間(最短4日)でCSVファイルをお返しいたします。

データ整備のStep3 データ再確認

データ整備が終わった後のCSVファイルがテーブル編集仕様に沿ったデータであることを、データ確認レポートによって確認いたします。

もしER図をいただくことができれば、テーブル間整合性レポートの作成も合わせていたします。

データ整備サービスで企業のお悩み解決

データ整備サービスをご利用になることで、企業が持つ以下のようなお悩みを解決することができます。

デジタルトランスフォーメーション(DX)関連のお悩み

「デジタルトランスフォーメーションを進めるために今あるデータの内容を確認しているが、データ量、データ数が多くて、手に負えない」

AI関連のお悩み

「AI用の機械学習(学習データ、適用データ、テストデータ)データ整備を複数人で作成しているが、品質にばらつきがあり、AIで思うような結果が得られない」

データ移行時のお悩み

「ERPシステムをクラウドサービスに移行したいが、データ移行費が高い」

「汎用機からオープン系へのマイグレーションに伴うデータ移行の工数を削減したい」

関連動画:柔軟な名寄せ

概算見積スタート

コンテンツ

前の記事

データマート