データエンジニアに入門して読んだ本とこれから読みたい本

2023年12月17日 engineering

この記事は、 検索エンジンプロダクトを一緒に開発してた同窓会 Advent Calendar 2023 の 17日目の記事です。


こんにちは、 @kz_morita です。

今年の 10 月に転職をし、Data Engineer という職で働き始めました。 いままでの転職でも別ジャンルのエンジニアリングをやることになるケースが多かったのですが、今回もマイナーチェンジという感じです。

もうすぐ 3ヶ月たちそうということで、どんな本を読んだかやどんな本に興味あるかなどをまとめてみようと思います。

こんなおすすめの本もあるよなどあったらぜひ教えてください。

なる前に読んだ本

有給期間とかに遊びほうけながら読んだ本です。

(もうちょい頑張って読めばよかった)

データ指向アプリケーションデザイン

データを中心に、アプリケーションとそれに関わるさまざまなトピックについて扱われている本です。

660 ページほどあり厚い本ですが、データとアプリケーションについてかなり広いトピックを知ることができるのでおすすめの本です。 実際に転職してからも、社内で話題に上がっていたり輪読会が開かれている気配などを感じていて読んでおいてよかったなーと思いました。

読んだ感想はこちら。

なってから読んだ本

仕事しつつ読み切った本たちです。

データマネジメントが 30 分でわかる本

こちらはデータマネジメントについてちゃんと理解しておきたいという時に最初の一冊として読みました。

後述する DMBOK という本を読む前の一歩として読みました。

内容としては、Data Management の全体雑をざっくりとつかむことができて非常に役立ちました。 とりあえずの第一歩目に読む本としてよかったなと思います。

読んだ感想はこちら。

Snowflakeの歩き方 Snowflake で始めるデータ基盤ガイド

仕事で Snowflake を触ることになりそうだったので、転職前に買ったら実は同僚の方が書いていたという本。

実務で触りながら読みました。

Snowflake 完全に初心者の人が、Snowflake の外観をつかむのに非常に役立ちました。 また、Snowflake の周辺のツールなどにも触れられているのがよかったです。 データエンジニアリング周りにはたくさんのツールがあってそれぞれ役割がありますが、実現したい目的が若干オーバーラップしていたりして、最初ツール何がどの目的のものかよくわからん、みたいになってました。 こういったデータエンジニアリングの周辺で扱われているツール群が紹介されているのは非常によかったです。

データ指向プログラミング"

こちらは社内で話題になっていて、楽しそうだったので読みました。

Data Oriented Programming について書かれている本で、データを中心に考えプログラミングするための原則などがまとめられている本です。

著者のブログ でも見ることができるので、こちらをみて面白そうだと感じる方は楽しめる本だと思います。

読んだ感想はこちら

これから読む本

いわゆる積読です。読みかけの本もあります。 多いので頑張って読みたい本リストです。

読みかけのたくさん本あるのよくないなーと思いつつ、あまり深く考えないようにしてます。

データマネジメント知識体系ガイド 第二版

いわゆる DMBOK というやつです。

少し読み進めていて、2 章までとデータ品質についての 13 章だけ読みました。

DAMAホイール図など、いろいろな勉強会やスライドで多く引用されていてまさにバイブルのようなものだと思います。

分量多いのでなかなか先は長いですが、ちまちま読み進めて行こうと思ってます。

実践的データ基盤への処方箋

こちらも有名な本だと思います。

3 分の 1 くらい読み進めています。

今読んだところまでの感想になりますが、詳細の技術というよりはデータ基盤はどのようにあるべきかどのように基盤を組織で作っていくのかといった大方針について語られている本だと思います。 最後まで読み切って感想書きたいなと思います。

チームトポロジー 価値あるソフトウェアをすばやく届ける適応型組織設計

こちらは、データ基盤について考えている上で気になって読みはじめました。

最近データ基盤にも Platform Engineering の考えを取り入れて Platform as a Product として構築するということについて考えることがあり、Platform Engineering の勉強会などに参加するなどしてキャッチアップしたりしていました。

↓参加レポート

上記の勉強会などで紹介されていたのがこの本です。

Platform として組織の他のチームとどう関わっていくのか?という点をこの本を読んで何か得られればなと思ってます。

Fundamentals of Data Observability

こちら洋書になるので、むちゃくちゃ読むスピードがゆっくりです。

Data Observability をデータ基盤に対してどう構築していくのかという点について、仕事で扱うことがあるので読もうと心に決めた本です。

翻訳ツール使いつつ少しずつ読み進めてます。 (洋書から逃げるなと自分に強く言い聞かせながら。。。)

内容については、Data Observability についての概要とそれをどのように実装するのか、データの問題をどのように検出するかといった話題について書かれていると思います。 頑張って読み進めます。

Fundamentals of Data Engineering

こちらは、上記と同じシリーズの本かなと思います。

こちらの本の方が、 Data Engineering という幅広いトピックについて書かれているかと思います。こちらも頑張って読みたい。

さいごに

今回は、データエンジニアリングに入門したときに読んだ本やこれから読みたいと思っている本を紹介してみました。

積読がたくさんあってよくないなーと思いつつ、まぁ気にせず読み続けるかーくらいの感じで最近はキャッチアップしています。 積読解消できるようにがんばります。

この記事が同じように、キャッチアップしようとしている方などの参考になれば嬉しいです。

皆さんのおすすめの本もありましたら、ぜひ @kz_morita まで教えてください。

この記事をシェア