コラム
2023年6月12日

昨今話題の「日本の住所のヤバさ」の課題を解決します!表記ゆれを解消し、住所の正規化を実現

住所の正規化
表記ゆれ

河野太郎デジタル相の「住所の表記ゆれにAI活用」発言で話題になっている日本の住所。一見すると簡単に正規化できそうですが、実はとても難解です。

日本の住所構成は、単純な階層構造ではなく都道府県・市区町村・郡に加えて、支庁・政令指定都市や大字・字、さらに住居番号・地番・支号、建物名を含む方書が存在するなど、住所表記が多岐に渡っています。
また、一部の住所表記を省略するケースや、似た文字に置き換えて記載されるケース、地域慣習により同一住所を示す表記が複数存在するケースなど、表記のゆれの解決には一筋縄ではいかない理由があります。

表記ゆれのケースはさまざま。だから表記の統一は超難問!

「1丁目」と「1-」「1の」等の表記ゆれはよくある例で、システム的に判断することは比較的容易です。
このようなケースでは「こんなものにAIは不要」「そんなんExcelでええやん」といった意見がでるのもわかります。しかし、以下のようなケースでは、住所の難解さを理解したうえで対策を打たないと表記ゆれの吸収はできません。

以下は、ほんの一例です。まだまだ難解な住所表記は存在します。

①京都の住所(通り名)

京都の住所では一つの公称地名に対して、複数の通り名が存在します。

公称地名
 京都府京都市中京区一之船入町

通称地名
 京都府京都市中京区御池通河原町東入一之船入町
 京都府京都市中京区御池通河原町東入上る一之船入町
  ︙
 上記を含む13の通り名が存在します。

②ガ・ケ・ツ・ノの書き方の違い

JR南武線の「武蔵溝ノ口駅」、東急田園都市線の「溝の口駅」、いずれも住所は「神奈川県川崎市高津区溝口」です。
中央・総武線の「四ツ谷駅」も住所は「東京都新宿区四谷」です。丸ノ内線の駅は「四谷三丁目駅」です。

よく目にする駅名等が正しい表記と勘違いされ、表記ゆれが起こりやすいケースといえます。

③石川県金沢市の小字表記(い・ろ・は)

い・ろ・は表記の住所が存在します。なかでも、読みは同じでもカタカナとひらがな、旧仮名で異なる地域の住所が存在します。
以下はそれぞれ異なる地域の住所です。

 石川県 金沢市 四十万町 イ
 石川県 金沢市 四十万町 い
 石川県 金沢市 四十万町 ヰ

④間違いやすい文字

手書き住所を手作業やOCRでデータ化する際、形の似ている文字と間違えて入力してしまうケースもあります。
過去には、「島根県松江市宍道町道」を「島根県松江市宍道町道」として入力されたケースがありました。

⑤同じ地名の繰り返し

同じ地名が繰り返されている住所は、省略して登録されるケースがあります。

過去の実績として、「秋田県 男鹿市 脇本 脇本 字脇本 〇番地」を「秋田県 男鹿市 脇本 字脇本 〇番地」と「脇本」を1つ省略して入力されたケースがありました。

「日本の住所のヤバさ」の課題を解決するおすすめ製品・サービス

これまでご説明してきたとおり、一筋縄ではいかない日本の住所表記の正規化。しかし、住所を取り扱うプロの製品やサービスを使えば解決は可能です!

アグレックスは1975年に住所マスターの販売を開始し、日本の住所と向き合いながら約50年にわたり、住所の表記ゆれを吸収するためのノウハウを蓄積してきました。そのなかで生まれた製品・サービスにより、「日本の住所のヤバさ」の課題を解決します。

すでに保有している住所データを正規化したい

アグレックスの製品である全国住所マスター「ADDRESS」は、販売を開始した1975年以降の日本全国の住所情報を全て蓄積しており、累計レコード件数は約30万件にのぼるマスターファイルです。データソースは、公益財団法人国土地理協会にて収集した最も正確な住所表記である、総務省ベースの行政上正式名称を採用しています。

この「ADDRESS」の情報を用いて住所コーディング/住所正規化ができるツール「AP-Converter」は、お客様ご自身で住所データの正規化が可能です。
また、お客様の顧客住所データをアグレックスがお預かりして、高精度な住所データメンテナンスを行う「住所クリーニングサービス」も提供しています。

住所データ無料診断サービス

無料で、お客様が保有する住所データの正規化レベルを診断します。(納品目安:お申込から3営業日)
「住所クリーニングサービス」により、どの程度まで表記統一や住所の最新化ができるのかを事前に把握できるため、安心してお任せいただくことが可能です。

無料診断を希望される場合は、フォームのお問い合わせ内容欄に「住所クリーニングサービスの無料診断希望」の旨を記載して送信してください。

  • 無料診断の上限住所レコード数は10万件を基本とします。それ以上となる場合はご相談ください。
  • ご提供いただいた住所データは診断以外では利用しません。診断終了後、速やかに破棄します。

これから登録する住所情報を正しい統一表記で蓄積したい

顧客情報入力支援ツール「Quick-Web Ver.3(住所)」は、WEB環境で住所情報を入力する際の情報のチェックにより、データ化の精度向上と省力化を可能にする入力支援ツールです。「Quick-Web Ver.3(住所)」にも「ADDRESS」のノウハウが活用されており、お客様の住所情報を、入力時から統一化された形式でデータ化することができます。

まとめ

ここまで解説してきたとおり、住所情報の正規化の難解さは日本の課題のひとつであり、住所情報を整備せずにそのままにしておけば、顧客情報の検索がしづらくなる、顧客への送付物の不着や二重送付が発生するなど、業務への支障も出てきます。

住所情報を正しく整備・管理することで、分析やマーケティング施策へ有効に活用できるようになるほか、顧客への重要書類の不着や誤送付をなくし、顧客からの信頼を保つことにもつながります。

企業は、すでに保有している顧客住所情報と、これから登録する顧客住所情報の両方でメンテナンスを行い、精度の高い情報を正しく保つことが大切です。

アグレックスの製品・サービスを利用して、住所情報の整備をしてみませんか?

  • 記載している情報は、記事公開時点のものです。最新の情報とは異なる場合がありますのでご了承ください。

コラムについてのお問い合わせ