正規表現の基本:Excel VBAでアドレスや郵便番号を確認

DE081:正規表現を活用して条件に合致するデータを抽出できる(メールアドレスの書式を満たしているか判定をするなど)

データ処理やクリーニング作業で、「特定のパターンに合ったデータだけを取り出したい」と感じたことはありませんか?正規表現を活用すると、複雑なパターンに基づいてデータを抽出したり、不要なデータを除去する作業が効率的に行えます。この記事では、メールアドレスの判定など、よくあるデータ操作の場面で使える正規表現の基本的な使い方を解説します。

正規表現とは?

正規表現は、文字列のパターンを定義して、そのパターンに合う文字列を検索・抽出するための表現方法です。たとえば、メールアドレス郵便番号など、フォーマットが決まっているデータを取り扱う際に非常に便利です。特定のルールに基づいてデータを整理・確認する場合、正規表現が強力なツールになります。

正規表現を使ったデータ抽出の具体例

1. メールアドレスのフォーマットを判定する

データベースやスプレッドシート内のデータで、メールアドレスの書式が正しいかどうかを確認することは、品質管理の一環としてよく行われます。正規表現を使うと、無効な形式のメールアドレスを効率的に検出できます。たとえば、以下のような正規表現を使うことで、正しいメールアドレスを抽出できます。

このパターンでは、「@」マークとドメイン名が正しいかどうかを確認しています。このルールに沿わないメールアドレスはフィルタリングされ、不正なデータを簡単に除外できます。

2. 郵便番号や電話番号の形式をチェック

郵便番号や電話番号も、決まった形式に従うデータです。正規表現を使用することで、正しい形式の番号のみを抽出できます。たとえば、日本の郵便番号(例: 123-4567)を抽出する場合、次のような正規表現を使用します。

これにより、ハイフンを含む7桁の数字に一致するデータだけを抽出できます。

3. 不要なスペースや特殊文字を除去

データをきれいに整えるためには、余計なスペースや特殊文字を取り除くことがよくあります。正規表現を使うと、こうした不要な要素を自動で削除できます。

このような正規表現を使えば、データの整形が非常に簡単になります。

Excelで正規表現を活用する方法

Excel自体は正規表現を直接サポートしていませんが、VBAを使えば正規表現を利用したデータ操作が可能です。以下は、Excel VBAで正規表現を使う例です。

このコードは、メールアドレスが無効なセルを赤くハイライトします。Excelのスプレッドシート内で大量のデータを管理する際に、非常に便利なテクニックです。

まとめ

正規表現は、データのパターンマッチングやフィルタリングの強力なツールです。メールアドレスや電話番号、郵便番号のチェック不要なスペースの除去といった作業に役立ち、特に大量のデータを扱う際に効果的です。ExcelのVBAを使うことで、日常的な業務にも正規表現を組み込むことができます。DE081で求められるこのスキルは、データ処理の効率化に直結し、ミスを防ぐための重要な技術です。

コメント

タイトルとURLをコピーしました