2023年12月31日 word cloud で 2023 年のブログを振り返る 2022年12月31日 word cloud で 2022 年のブログを振り返る こんにちは、 @kz_morita です。 2022年も年の瀬になりました。 今年も一年間週一でブログを書き続けることができ、この記事を入れて合計で52記事を書くことができました。 そこそこ書けたので毎年恒例の word cloud で振り返ってみます。 word cloud 手法は過去の記事と同様です。 word cloud で今年のブログを振り返る 今年は以下のような結果になりました。 今年は、Scala が多かったように思います。また Windows PC を購入していろいろな環境構築をしたので、インストール などの単語も含まれていそうです。 今年書いた scala タグ がついている記事は以下のとおりです。 Scala の並列コレクションで処理を高速化する scala-uri で角括弧を含む文字列が Parse Failed する件の調査ログ scala-redis を使ってみる Scala で Duck Typing を使ってコードを共通化する Scala の 型パラメータによる抽象化 Scala で shapeless を使ってみる Scala で List から Mapに変換する Scala で既存の型を拡張する WSL 上にScala の環境を構築する Scala の Regex で全角半角を無視して match する方法 Scala で case class をソートする Scala から Parameter Store のデータにアクセスする Scala で Retry 処理を実装する Mockito でメソッドの呼び出し回数のテストをする 14記事書いていたみたいです。 去年は入門記事だったのに対し、今年は実際に開発してみて躓いたところやライブラリについてなどより一歩深いところの記事がかけたんじゃないかなと思います。 2021年12月28日 word cloud で 2021 年のブログを振り返る こんにちは、 @kz_morita です。 今年も無事週一でブログを書き続けることができたので、今年のブログの内容を word cloud で振り返ってみます。 今年は、どうやら 52 本の記事を書いていたようです。 word cloud で振り返る 手法は、去年と同じなので、よかったら参考にしてみてください。 word cloud で今年のブログを振り返る 早速 wordcloud の結果を見てみます。 目立つのは、データ, scala, lambda, 関数 あたりでしょうか。 データ関連で言うと、以下のような記事を書きました。 Redshift 分析のための Window 関数まとめ Google Colaboratory で Google Drive 上のファイルを読み込む さまざまなデータベースの分類について データベースのデータレイアウトについて Apache Lucene の Index の仕組みを探る scala 関連は開発環境の構築と入門記事を書きました。 Java を jenv を使って環境構築する Scala と IntelliJ で開発環境のセットアップ M1 Mac に sbt を入れて Scala 3 の REPL を使用する Scala入門 その1 基本型とリテラル Scala 入門 その2 制御構文 Scala入門 その3 クラスとオブジェクト Scala入門 その4 トレイト Scala入門 その5 関数とクロージャ Scala入門 その6 コレクション操作 Scala入門 その7 テスト lambda はおそらく AWS 関連の話だと思います。AWS関連は以下のような記事を書きました。 2020年12月22日 word cloud で 2020 年のブログを振り返る この記事は、 write-blog-every-week Advent Calendar 2020 の 22 日目の記事です。 こんにちは、 @kz_morita です。 年末になり、今年を振り返るモードになっていますが、今年もなんとか週一でのブログ更新を続けることができました。 週一で書き始めたのが、2018年8月31日の この記事 からなので、2年3ヶ月 ほど続いたことになります。 こんなに続いたのは、完全に write-blog-every-week のおかげです。今年もありがとうございました。 write-blog-every-week については、こちら Write Blog Every Week 勢いで週一ブログ書くslackグループを作った write-blog-every-week について word cloud で振り返る 昨年の記事 でもやりましたが、今年のブログを word cloud で振り返ってみます。 手法は、去年と同じなので、よかったら参考にしてみてください。 word cloud で今年のブログを振り返る どうやら、Rust についてが多かったようです。 確かに、rust タグの記事をみてみると今年で、7 件書いていたようです。 rust タグ あとは、情報検索とネットワーク周りもおさらいしていたので、検索 や、通信 のようなワードも大きいですね。 可視化してみると面白いです。 来年に向けて 今年も振り返るとたくさんブログを書いたなぁと思います。 前半は仕事で忙しかったですが、終盤で自分がずっとやりたかった検索周りの話や、Rust について記事をかけていたのはよかったかなぁと思います。 来年も、自分が学びたいことを中心にブログを書き続けていきたいですね。 来年のブログ振り返りで、面白い wordcloud が見れるように頑張ります。 2019年12月28日 word cloud で今年のブログを振り返る こんにちは、 @kz_morita です。 12/23 日に行われた、「エンジニアの成長を応援する忘年 LT 大会 2019」 というイベントに参加させていただき、そこで「ブログを書き続けた話」というタイトルで 2019 年のブログの執筆を振り返る LT を行いました。 そのなかで以下のような、Word Cloud を用いてブログの内容を可視化してみたところ面白かったので、今日はその Word Cloud について書いていきます。 Word Cloud とは? Word Cloud は上記の画像のように、単語の出現頻度を可視化するテキストマイニングの手法です。テキストマイニングといったら難しそうですが、ライブラリが用意されていて非常に簡単につくることができます。 ライブラリはこちら。 https://github.com/amueller/word_cloud 全体のながれ 作成の流れとしては以下のようになります。 可視化したい文章の準備 前処理 (不要文字の削除, Stop Word) 実行 説明の都合で上記順番で説明していますが、実際には、文章を準備 → 前処理 → 実行 → 前処理 → … となんども前処理を調整しました。 それでは順を追って説明していきます。 可視化したい文章の準備 今回は 2019 年に書いた記事を抽出したかったので、以下のようにコマンドでテキストファイルにしました。 $ grep 2019 -rl ./content/posts/ | xargs cat > blog.txt grep コマンドの “-l” オプションでパターンを含むファイル名だけを標準出力できるので、それを cat で ファイルの内容を標準出力に書いたのを、blog.