コラム
2025年2月4日

なぜ「データクレンジング」が必要なのか?公的個人認証サービスをめぐる最新動向から解説

データクレンジング
公的個人認証サービス
照合の壁

公的個人認証サービス(JPKI:Japanese Public Key Infrastructure)という言葉を聞いたことがある方もいるかもしれません。公的個人認証サービスとは、主に非対面での行政手続きにおいて、他人によるなりすまし申請や電子データの改ざんを防ぐために用いられる本人確認の手段です。

一方で、公的個人認証サービスは、本人認証となりすまし防止を目的とした情報提供のみであり、反社チェックや自社顧客情報との照合など、顧客管理をサービス事業者側で実施する必要があります。

本記事では、まずは公的個人認証サービスとはどのようなものか解説し、そのうえで公的個人認証サービスを利用した顧客管理を効率的に行う方法について説明します。

公的個人認証サービスとは

ここでは、公的個人認証サービスとはどのようなものなのかを解説するとともに、このサービスの最新動向についても触れていきます。

公的個人認証サービスを解説

公的個人認証サービスとは、マイナンバーカードのICチップに搭載された電子証明書を利用したサービスです。非対面で利用者本人の認証を行ったり、契約書等の文書が改ざんされていないかどうかを公的に確認したりします。マイナンバー自体は使用せず、安全に本人確認を行えます。

冒頭でも触れましたが、公的個人認証サービスは非対面での行政手続きだけでなく、銀行や証券会社の口座開設、ローン契約などの民間サービスでも利用されています。

公的個人認証サービスの最新動向

公的個人認証サービスと密接な関係があるのが「マイナンバーカード」です。マイナンバーカードは、機能拡充が進んでおり、保有率が増加傾向です。まず、2023年にAndroid™へマイナンバーカード機能が搭載されました。2025年春後半にはいよいよiPhoneへの搭載が予定されています。また、2024年に「マイナ保険証」、2025年には「マイナ免許証」との一本化が進んでいます。
このように、マイナンバーカードはますます私たちの身近な存在になってきています。

こういった中で、犯罪で得た収益を使って、マネーロンダリングやテロ行為への資金供与を防止する目的で、なりすましのリスクを減らすため、金融機関など特定事業者に対して厳格な本人確認が義務付けられました。

犯罪収益移転防止法に加えて、携帯電話不正利用防止法に基づく非対面の本人確認手法をマイナンバーカードの公的個人認証に原則一本化することが閣議決定されました。

「照合の壁」とは

ここまで公的個人認証サービスについて説明しましたが、便利なものである一方で課題も存在します。それを「照合の壁」と呼んでいます。

公的個人認証サービスでは利用者による同意を前提に、本人確認結果をサービス事業者へ提供します。この情報に含まれる本人属性情報は基本4属性と呼ばれ、氏名、住所、生年月日、性別が対象であり、これは住民基本台帳ネットワークシステム(以下、住基ネット)で保有されている情報と同一です。

住基ネットは各市町村の住基システム情報の集合体です。つまり、個々の自治体で異なるシステムや異なる管理ルールにデータ登録が依存するため、表記ゆれは発生しやすい状況といえます。

「照合の壁」の具体例

では、公的個人認証サービスにおける「照合の壁」について具体例を見ていきましょう。

パターン例①

公的個人認証サービスでは住所文字列のみ返却しますが、サービス事業者が住所を分割管理するケースでは、郵便番号がない点もあり文字列での照合は手間がかかります。日本固有の通称、ハイフン/丁目などの揺れも照合が複雑となる要因の一つです。

パターン例②

実は住基システム上の氏名は、住民が手書きで記載したくずし字や書き癖を基に、文字としてデータ化されています。そのため、取り扱われる文字数はスマートフォンで使用可能な1万文字を大幅に超えています。

例えば、「邊」という文字は、代表的な例です。「方」と「口」、「ウかんむり」と「ワかんむり」「自」と「白」、「いちしんにょう」と「にしんにょう」等、さまざまなバリエーションが存在します。このような複雑な文字を、スマートフォンで使用可能な文字にシステム上で対応付ける作業が必要となります。

対応付けが行われていない場合、特定の自治体システムでは印字が可能でも、他のシステムや住基システムとの情報連携時に文字が認識されない可能性があります。その結果、公的個人認証サービスから返却される文字の一部がシステム上で認識できない事態が発生することがあります。照合時にはこうしたケースを想定し、考慮することが重要です。

パターン例③

さらに氏名の場合、住基ネット上では旧姓や外国人住民の通称を併記できます。併記した場合、氏名欄には複数情報が記載されています。

一方、サービス事業者は「氏名(旧姓含む)」か「読み仮名」のいずれかで管理している場合もあり、こちらも照合に手間が掛かってしまいます。

「照合の壁」を突破するには

以上、照合の壁における具体例をご説明いたしました。この壁を突破するための切り口として、照合時にこういったケースを想定することや、照合できるデータの生成が肝要です。

データクレンジングの有効性

照合できるデータの生成において求められるのが、「データクレンジング」と呼ばれる工程です。以下で詳しく見ていきましょう。

データクレンジングとは

データクレンジングとは、フォーマットの統一、文字列の置換、表記の統一を行い、照合しやすい形式に整えることです。データクレンジングにより、照合の精度を向上させることが肝要です。公的個人認証サービスでは「基本4属性」が返却されますが、特に氏名と住所は表記ゆれが発生しやすい属性です。それぞれの属性に起こりえるケースを一部紹介します。

▼氏名

住基ネットで保有している氏名情報は、漢字の情報しか持っていないケースや、旧姓を括弧書きで登録しているケースもあり、事業者側のデータと単純照合できないという声をお聞きします。このような場合、漢字氏名から振り仮名を導きだし、さらに姓と名の情報を分割することで、照合の精度を向上させることが可能です。

▼住所

日本の住所構成は、単純な階層構造ではなく都道府県・市区町村・郡に加えて、支庁・政令指定都市や大字・字、さらに住居番号・地番・支号、建物名を含む方書が存在するなど多岐に渡っています。また、一部の住所表記を省略するケースや、似た文字に置き換えて記載されるケース、地域慣習により同一住所を示す表記が複数存在するケースなど、日本の住所表記は非常にバラエティが豊富です。

表記統一されていなくとも、日本の配達事業者は優秀なため配達できないことはほとんど発生しません。しかし、データ照合となると一文字でも違っていると照合ができないため、表記統一しなければならない場合が多く発生します。アグレックスでは、住所のマスター情報に正規化して照合の精度を向上させることが可能です。

データクレンジング・名寄せに関しては、以下の関連記事もご覧ください。

アグレックスの「Precisely Trillium」

アグレックスでは、大規模データ統合で発生するデータの不統一を解消し、高品質なデータクレンジングを実現する「Precisely Trillium」を提供しています。

Precisely Trillium関連ソリューション(データクレンジング・名寄せ)についてはこちら

データクレンジングで「照合の壁」を突破しよう

以上のように、「照合の壁」はデータクレンジングを活用することで乗り越えることが可能です。

また、顧客情報の管理もデータクレンジングサービスを活用することで、さらなる効率化が期待できる点についてもご理解いただけたのではないでしょうか。

アグレックスでは、データクレンジングや名寄せなどのデータ管理以外にも、データの利活用などデータに関わるお客様のあらゆる課題解決を支援し、新しい価値を提供しています。自社データの現状分析や課題特定のための「データ診断サービス」なども実施しておりますので、データに関わるお悩みがありましたらお気軽にお申し付けください。

  • データ診断サービス結果イメージ

また、今後公的個人認証サービスを利用したサービス展開をご検討中の方も、お気軽に下記フォームよりお問い合わせください。

  • 記載している情報は、記事公開時点のものです。最新の情報とは異なる場合がありますのでご了承ください。
  • AndroidはGoogle LLCの商標または登録商標です。
  • iPhoneは、米国および他の国々で登録されたApple Inc.の商標です。iPhoneの商標はアイホン株式会社のライセンスにもとづき使用されています。

コラムについてのお問い合わせ