はじめに
こんにちは!名古屋支店でEight事業部プロダクト部に所属する齊藤です。
Sansanに中途入社して2年目を迎えました。
普段はMeetsというサービスの開発・運用に携わっています。
今回人生で初めてビックデータを使った本格的なETL処理を実装することになり、AWS Glueを触りました。
最初はどうチューニングしていいか分からず、思うような処理速度が得られない状態から、最終的には期待以上に早く作業を終わらせることができたので、その中から得られた知見として、チューニングポイントを4つ共有したいと思います。
Glueを使いはじめた人向けの記事になると思います。EMRとの比較は、今後業務で触ることがあれば書きたいと思います。