Glue Data Qualityで品質検査ルールに不合格となったレコードを特定する

2024.06.24 8:00
Classmethod.jp

データアナリティクス事業本部インテグレーション部機械学習チーム・新納(にいの)です。 データのETLを担うサービスであるAWS Glueの機能群の一つ、Glue Data QualityではGUIベースの操作でデータの品質検査が可能です。データレイクやデータウェアハウスへのデータ投入前に、値の長さチェックや特定カラムがNULLでないかどうかなど、あらかじめ定義しておいたルールに合格しているかどうかを確認できます。 今回は、定義したルールに不合格となったレコードを特定する方法を検証してみました。 Glue Data…

検索

人気記事

2024.09.06 11:17
2024.08.08 17:30
2024.07.29 19:00
2024.04.19 20:24
2024.09.04 9:12

コメント一覧

まだコメントはありません。

コメント