コラム
2023年5月12日

データをマスキングして活用しましょう!メリットやおすすめツールのご紹介

データマスキング
データ利活用

本記事は、データの機密性を保持しながらデータの活用を推進できる「データマスキング」について解説します。

特に、フリーテキストのマスキングについてメリットや活用事例、おすすめのツールまで紹介します。本記事を参考に、データの利活用とセキュリティの両立を目指しましょう。

データのマスキングって?データ活用への第一歩

まずは、データのマスキングの概要を解説します。

データのマスキングとは、システムやアプリの開発でデータを送信する際やデータを分析・活用する際に、データの機密性を高めるために行う工程を指します。具体的には、データの一部を書き換えることで、個人の特定を防止します。

マスキングすることで、個人情報を含むデータの機密性が上がり、データ活用の可能性が広がります。

フリーテキスト内の個人情報はどうやってマスキングする?

フリーテキストとは、応対履歴や音声認識テキストなど形式が定まっていない文章を指します。

応対履歴や音声認識テキスト、アンケートの自由記入欄などは個人情報が含まれる可能性が高く、慎重に取り扱う必要があります。社内におけるデータ利用においても、制限がかけられるのが一般的です。

フリーテキストをマスキングする場合は、文章の形式が定まっていないことから個人情報の判定が難しく、マスキング作業には手間がかかります。また、膨大なデータ量がある場合、目検や手作業でのマスキングは非効率であり処理ミスのリスクもあるため、注意が必要です。

フリーテキスト内のデータをマスキングするメリット

ここでは、フリーテキスト内のデータをマスキングすることで得られるメリットを解説します。

万が一に備えて個人情報漏えいリスクを低減できる

個人情報を含むデータを扱うにあたって、マスキングすることは法令で義務付けられていません。ただし、万が一個人情報の漏えいが発生してしまうと、個人の権利等を侵害するおそれが大きい場合、個人情報保護委員会への報告と本人への通知が義務付けられています。

匿名化されていないデータを扱うことは、たとえ社内であっても漏えいのリスクを伴います。データをあらかじめマスキングしておけば、万が一漏えいした際にも個人情報が匿名化されているので、リスクに備えることができます。

データを安全に利活用できる

データマスキングにより個人情報漏えいリスクを低減したデータは安全に活用できます。フリーテキストには、お客様の実際の声などの利用価値の高いデータが含まれている反面、漏えいした場合のリスクが大きいため、データの機密性を高めることができるマスキングは効果的です。

フリーテキスト内のマスキングデータ活用事例

ここでは、実際にフリーテキスト内のデータをマスキングし、利活用につながった事例を見ていきましょう。

ケース1:コンタクトセンターに集まるお客様の声を分析・活用

コンタクトセンターには、問い合わせなどのお客様の声が非常に多く届きます。それらのデータを活用できれば、ホームページやFAQを充実させ、お客様の利便性の向上につなげることが可能です。しかし、問い合わせのご意見やご要望には個人情報が含まれており、データ利活用のためには分析過程での個人情報を保護し、安全な環境で扱う必要がありました。

そこで、フリーテキスト内の個人情報を機械的に検出し、それらをマスキングされた文字列に変換することのできるツールを導入しました。

導入後は、個人情報がマスキングされたデータを用いることで、個人情報漏えいのリスクを低減しながら業務を行うことが可能です。安全な環境下で継続的にデータを利活用することで、問い合わせの傾向を詳細に分析することができるようになりました。

結果として、網羅的で精度の高いFAQを作成し、お客様の問題のスピーディな解決につながりました。この事例は、フリーテキスト利活用の代表的な事例の1つになります。

ケース2:アンケート自由記述欄の分析・活用

飲食店をはじめとしたサービス業では、サービスへの満足度を調査するためにアンケートを実施することがあります。その際に、項目ごとの満足度を一般的な5段階で評価するだけではなく、より詳細な評価を書き加えるための自由記述欄を設けることもあります。

自由記述欄は、数字での評価にはない重要なヒントと個人情報が含まれています。つまり利活用のためには、その個人情報を保護する必要がありました。

そこで、ケース1と同じく、フリーテキスト内の個人情報を自動的にマスキングしてくれるツールを導入しました。

導入後は、漏えいリスクを低減した安全な環境で、自由記述欄の分析と活用が可能になりました。さらに、膨大なデータの活用により、お客様のご要望やご意見をより具体的に把握することができ、新規サービス企画やサービス改善に活用し顧客満足度向上を実現しました。

フリーテキスト内のマスキングをもっと効率よく!ツール利用のススメ

データのマスキングには、決まったルールで自動的にマスキングを行うツールを利用するのが有効です。

しかし、応対履歴や音声認識テキストなどのフリーテキストには形式がないため、目検や手作業でのマスキングを行なっている企業も少なくありません。ただこの方法では担当者に負担がかかってしまいます。

そこで、フリーテキストのマスキングが可能なツールを活用すれば、効率よくデータの利活用ができます。

自動で情報を抽出し、業務効率UP!

形式のないフリーテキスト内の個人情報でも機械的に判別することができ、業務効率を大幅に改善することができます。

デジタル化により、膨大でより複雑になったフリーテキストのデータも、ツールを用いると一括でマスキングすることができ効率化につながります。

マスキング漏れやミスを低減

手作業でフリーテキストをマスキングするにあたって、効率のほかに問題となるのがヒューマンエラーです。しかし、フリーテキストのマスキングツールを導入すれば、自動で個人情報を抽出してマスキングすることができるため、漏れやミスを低減できます。

目検や手作業でのマスキングの漏れやミスは、個人情報漏えいの重大なリスクにつながる恐れがあるため、この点もツールを用いることの大きなメリットになります。

企業独自のマスキングルールも適用可能

今までデータマスキングを手作業で行ってきた企業には、独自のマスキングルールがあるかもしれません。

もちろん、フリーテキスト内のマスキングを行うツールでも、あらかじめ設定をすることで、細かなマスキングルールに対応することが可能です。この機能があるツールを選択すれば、自社に合った形にカスタマイズすることができ、データ利活用の幅が広がります。

おすすめのデータマスキングツール「フリーテキストマスキング」

ここでは、おすすめのデータマスキングツール「フリーテキストマスキング」についてご紹介します。

フリーテキストマスキング」は、株式会社アグレックスが提供するツールであり、フリーテキスト内にある個人情報のマスキングが可能です。氏名や住所、電話番号、クレジットカード番号、メールアドレスなどの個人情報を機械的に判定し、マスキングされた文字列に変換します。

<処理イメージ>

アグレックスでは、データクレンジング・名寄せツールや、住所や金融機関、学校、姓名等の各種マスター製品も提供しており、それらのノウハウを集約した独自のアルゴリズムが搭載されています。したがって、高い精度での個人情報の検出が可能になっています。さらに、企業独自の拡張辞書を登録することも可能です。

フリーテキストマスキング」は、手作業と比較して約85%の作業効率向上の効果が出ており、これまで手作業で行っていたフリーテキスト内の個人情報のマスキングを本ツールに変えるだけで、大幅なコスト削減と業務効率化につながります。

また、スタンドアローンでの実行が可能になっており、クラウドなどにアップロードする前やデータ共有前にオフライン環境下で使用することで、よりセキュアにデータを取り扱うことができます。

このツールを用いれば、より安全かつ効率的に、クラウドの分析ツール活用や別部門へのデータ展開、他社への業務委託に加え、リモートワークでのデータ活用などを行うことが可能になります。

まとめ

ここまで、フリーテキストのデータマスキングについて解説してきました。

フリーテキスト内の個人情報をマスキングすることは難しいことも多く、さらに膨大なデータを手作業でマスキングするのはとても手間がかかるでしょう。

しかし、応対履歴や音声認識テキスト、アンケートの自由記述欄などには有用な情報が含まれています。そのため、個人情報の取り扱いに留意しながら利用することが大切です。

フリーテキスト内の個人情報をマスキングする際は、専用ツールの活用がおすすめであることも記述しました。ツールを使えば業務効率化につながるだけでなく、人的ミスを低減できるためより安全にデータの利活用が可能になります。

そこで、おすすめなのがアグレックスの「フリーテキストマスキング」です。本記事を参考に、導入を検討してみてはいかがでしょうか。

  • 記載している情報は、記事公開時点のものです。最新の情報とは異なる場合がありますのでご了承ください。

コラムについてのお問い合わせ