Apache Arrow

Apache ArrowとCMake - FetchContent

Apache Arrowの開発に参加している須藤です。現時点でapache/arrowのコミット数は1位です。私はRubyでデータ処理できるようになるといいなぁと思ってApache Arrowの開発に参加し始めました。同じような人が増えるといいなぁと思うので、最近の活動を紹介して仲間を増やそうと試みます。

今回はApache Arrow C++で使っているビルドツールCMakeFetchContentという機能を紹介します。

もっと読む

Apache ArrowのCI - Crossbow

Apache Arrowの開発に参加している須藤です。現時点でapache/arrowのコミット数は1位です。私はRubyでデータ処理できるようになるといいなぁと思ってApache Arrowの開発に参加し始めました。同じような人が増えるといいなぁと思うので、最近の活動を紹介して仲間を増やそうと試みます。

今回はapache/arrowリポジトリーで使っているCIツール「Crossbow」を紹介します。

もっと読む

Apache Arrowのリポジトリー分割

Apache Arrowの開発に参加している須藤です。現時点でapache/arrowのコミット数は1位です。私はRubyでデータ処理できるようになるといいなぁと思ってApache Arrowの開発に参加し始めました。同じような人が増えるといいなぁと思うので、最近の活動を紹介して仲間を増やそうと試みます。

今回はapache/arrowリポジトリーでやっているリポジトリーの分割について紹介します。

もっと読む

Apache Arrow東京ミートアップ2025を開催したよ!

Apache Arrowの開発に参加している須藤です。Apache Arrow東京ミートアップを6年ぶりに開催しました!

もっと読む

GroongaでApache Arrowフォーマットを使ってみるよ!

Apache Arrow東京ミートアップ2025に参加予定の阿部です。

GroongaはApache Arrowフォーマットでのデータロードと検索結果の取得に対応しています。 今回は実際にそれを使ってみる企画です。

Apache Arrowフォーマットのデータを作るところからやってみます。 次の流れで進めていきます。

  1. Apache Arrowフォーマットのデータを作る
  2. GroongaにApache Arrowフォーマットでデータをロードする
  3. Groongaで検索してApache Arrowフォーマットでデータを得る

もっと読む

Apache Arrow 20.0.0からAPT/Yumリポジトリーが変わるよ!

Apache Arrowの開発に参加している須藤です。そろそろApache Arrow 20.0.0がフィーチャーフリーズされて、4月の中旬から下旬くらいには20.0.0がリリースされます。そんな20.0.0で予定されている変更の1つであるAPT/Yumリポジトリーに関する変更を紹介します。

互換性があるように変更するのでいきなり動かなくなることはないはずですが、長い目で見ると変更に追従しておいて欲しい、といった変更になります。

もっと読む

Apache Arrow東京ミートアップ2025を開催するよ!

Apache Arrowの開発に参加している須藤です。Apache Arrow東京ミートアップを6年ぶりに開催します!

もっと読む

Gandivaが使っているLLVMのJIT機能をMCJITからORCv2にしたらシンボルが見つからないエラーになっていたけどLLVM 18.1で直った

Apache Arrowの開発に参加している須藤です。LLVMは詳しくないし、LLVMのどのコミットで直ったとかも調べていないし、私はレビューとか調査をしていただけで実装していないとかなんですが、最近、数年越しのGandivaの問題が直ったので雰囲気で紹介します。

もっと読む

Apache Arrowフォーマットはどのようにクエリー結果の転送を高速にしているのか

Apache Arrowの開発に参加している須藤です。先月、Apache Arrowの公式ブログにHow the Apache Arrow Format Accelerates Query Result TransferというApache Arrowフォーマットを使うとなぜクエリー結果の転送が高速になるのかを説明した記事が投稿されました。すごくよくまとまっている内容で、今後、何度も参照したくなりそうでした。ということで、Apache Arrowの公式ブログに翻訳記事を追加しておきました。昨今の機械翻訳は精度がかなり上がっているので人手の翻訳がなくても読みたい人は読む気はしますが、検索したときに見つかりやすくなるかもなぁと思ってやっておきました。

詳細はこの翻訳記事を読んでもらうとして、ここでは簡単に概要を紹介しておきます。

もっと読む

Apache Arrow 19.0.0

Apache Arrowの開発に参加している須藤です。19.0.0がリリースされたので紹介します。

もっと読む