ガースー日記

笑ってはいけないネタに惹かれて、昔は黒光り日記、というブログ名でやってました。(大学生のノリでした..)

スタースキーマの勉強会で話してきた

データエンジニアが集まっているdatatech-jpとは

データエンジニアが集まってる datatech-jpという公開のslackがあるのですが、そこでは輪読会や勉強会が行われています。

datatech-jp.github.io

 

僕自身、面白そうな勉強会は何度も参加させてもらっていますし、何より自分よりも経験の豊富なエンジニアの方々の議論を聞いてるだけでも勉強になります。

 

内容によっては議論に全然着いて行けなかったり、多少議論に参加できることもあるので、自分のレベル感を推し量る物差しにも利用しています。

 

上記の一環で #star-schema-the-complete-reference というチャンネルでスタースキーマの勉強会がありました。

内容としては、下記の輪読会ですね。

www.amazon.co.jp

 

僕自身、データのモデリングに関しては当初全く知識が無く、何となくDWH、データマートを設計していました。

実際それで、運用コストの高いシステムを作ってしまった反省も経験してきました。

(僕が主に設計したとあるレポート作成回りのシステムは、2022年6月頭にリプレイスすることになって、一旦運用を停止しました。

この話は個人的には反省しかないので、機会があれば書きたい..)

 

スタースキーマの勉強会は最初、単純に聞き手として参加していました。

ただ、気になる章は誰も手を上げていなかったので立候補させてもらい、発表した、という経緯です。

 

実際に作成した資料

外部での輪読会の発表は、新卒の時に先輩に誘われてやった時以来でした!

 

僕が担当したのは18章の一番最後ですね

最後なので今までの章に関して理解してないと読み解けないのですが、実際のフローとしてどうやってモデリングしていくのか?を書いてる重要な章かなと思ってます

 

抽象的な概念が多く、結構読み解くのに苦労しましたし、いまだに腹落ちしてない部分もあります..

www.notion.so

 

内容に関しては、上記を見てもらえたらと思いますので詳細は割愛します。

ディメンジョンとファクト部分のマッピングを行う部分とか、アンチパターンに関して色々記載があったのはとても勉強になりました。

 

 

そもそも論、スタースキーマは古の手法と言われるようになっています。

直近だと datatech-jpでも data-valutの勉強会も行っていますし、社内でもdbtを導入してdbtvalutを利用する等の検討を行ってる最中です。

 

ただ基礎的な概念として今回インプットすることができたのは非常にいい経験になりました。

あとNotionを初めて使ったのですが、めちゃくちゃ便利ツールだったので皆さんにお勧めしたい笑