DE087:表計算ソフトのデータファイルに対して、規定されたリストと照合して変換する、都道府県名からジオコードに変換するなど、ある値を規定の別の値で表現できる
データ分析や業務報告書を作成する際、都道府県名を対応するコード(ジオコード)に変換する場合や、製品コードを製品名に置き換えるといった特定の値を別の値に変換する場面があります。このような作業を手動で行うと時間がかかりますが、Excelの機能を使うことで効率的に処理が可能です。
本記事では、Excelでリスト照合を行い、特定の値を別の値に変換する方法を解説します。
ジオコードとは?
ジオコードとは、地理的な位置や地域を識別するために使われる一意のコードです。例えば、日本では都道府県にそれぞれ対応するコードが割り当てられています。これにより、都道府県をシステム内で一意に識別でき、効率的に処理を行うことが可能です。
都道府県のジオコードの例
- 北海道:01
- 東京都:13
- 大阪府:27
ジオコードを使うことで、システム間でデータを正確にやり取りしたり、データ分析を行う際に都道府県名を一意の識別子として利用することができるため、統一したデータ管理が実現します。
リスト照合とデータ変換の必要性
リスト照合は、データセットにおいて、特定の値を別の定義済みリストと照合して変換するプロセスです。これにより、データの一貫性を保つことや自動化による効率化を期待できます。
Excelでリスト照合を使ったデータ変換方法
Excelでリスト照合を行うには、主にVLOOKUP
関数やXLOOKUP
関数を使用することで、実現できます。
VLOOKUP関数
Excelでよく使われるリスト照合の基本関数です。縦方向にデータを検索し、対応する値を返します。シンプルで幅広いバージョンで使える反面、照合列がリストの左端に限られるという制約があります。
XLOOKUP関数
VLOOKUPの強化版で、左右どちらからでも照合が可能です。検索結果が見つからない場合にエラーではなく任意の値を返せる点が便利ですが、新しいバージョンのExcelでしか使えません。
データ変換時の注意点
データ照合・変換時に以下の点に注意しましょう。
一貫した入力形式
都道府県名などの照合対象データは、統一された形式で入力されている必要があります。例えば、「東京都」と「東京」といった異なる表記があると、照合が失敗します。事前にデータクリーニングを行い、表記の統一を図りましょう。
範囲外のデータ処理
もしリストにないデータが含まれている場合、適切なエラーハンドリングを行うことが重要です。VLOOKUP
関数の場合は、IFERROR
関数を組み合わせると、エラー時に代替のメッセージや値を表示できます。これにより、照合リストにない場合でもエラーが出ず、「該当なし」と表示されます。
まとめ
Excelを使ったリスト照合変換は、データの一貫性を保ち、手作業で行う場合に比べて効率的に変換処理ができます。特に、大量のデータを扱う場合や、都道府県名からジオコードへの変換のような定期的な作業には、この方法が非常に有用です。
データサイエンティスト検定DE087のスキル向上を目指し、ぜひこれらの方法を活用してみてください。
コメント