Glue Data Qualityで品質検査ルールに不合格となったレコードを特定する

2024.06.24 8:00
Classmethod.jp

データアナリティクス事業本部インテグレーション部機械学習チーム・新納(にいの)です。 データのETLを担うサービスであるAWS Glueの機能群の一つ、Glue Data QualityではGUIベースの操作でデータの品質検査が可能です。データレイクやデータウェアハウスへのデータ投入前に、値の長さチェックや特定カラムがNULLでないかどうかなど、あらかじめ定義しておいたルールに合格しているかどうかを確認できます。 今回は、定義したルールに不合格となったレコードを特定する方法を検証してみました。 Glue Data…

検索

人気記事

2023.12.20 14:26
2023.12.21 18:34
2024.02.21 8:44
2023.11.30 9:20
2023.12.25 15:00

コメント一覧

まだコメントはありません。

コメント