代表取締役 須藤功平が次世代データ処理基盤Apache Arrowのカンファレンス『The Data Thread』に登壇 - クリアコード

プレスリリース

株式会社クリアコード > プレスリリース > 代表取締役 須藤功平が次世代データ処理基盤Apache Arrowのカンファレンス『The Data Thread』に登壇

代表取締役 須藤功平が次世代データ処理基盤Apache Arrowのカンファレンス『The Data Thread』に登壇

2022年6月22日

株式会社クリアコード

株式会社クリアコード(本社:埼玉県所沢市、代表取締役:須藤 功平)は、代表取締役 須藤功平が2022年6月24日1:00am-4:00amにオンライン開催される 『The Data Thread』に「Why Apache Arrow is important for Ruby」と題し、ビデオ登壇することをお知らせします。『The Data Thread』は、Apache Arrow*1の開発をリードするVoltron Data社が主催するカンファレンスイベントで、Apache Arrowとそのエコシステムに関連する革新的な最新情報や技術が紹介されます。

講演の概要

次世代データ処理基盤として期待されているApache Arrowは10以上のプログラミング言語で利用できるため、異なるプログラミング言語で実装された各種データ処理プロダクトを効率よく連携できます。長らくRubyコミッターとして活躍してきた須藤が、Apache ArrowがRubyでのデータ処理にもたらす可能性や、Apache Arrowに関わる取り組みについて紹介します。

2016年よりApache Arrowの開発に参加し、2017年5月にコミッターに就任、2017年9月にプロジェクト管理委員会メンバーに就任。2022年3月時点でコミット数は3位。2022年1月からプロジェクト管理委員会のchairに就任。日本でのApache Arrow普及を目的として、開発のみならず各所でのApache Arrowの 紹介を精力的に行っている。またApache Arrowの開発状況を定期的にまとめ、日本語の記事として公開している。も公開している。

The Data Threadの概要

イベントは英語を主言語としています。登壇分は日本語音声と英語字幕です。

Apache Arrowの概要

Apache Arrowは、大規模データの交換処理を効率化するソフトウェアで次世代データ処理基盤として期待されています。Apache Arrowは10以上のプログラミング言語で利用できるため、異なるプログラミング言語で実装された各種データ処理プロダクトを効率よく連携できます。2016年から開発が進み、2020年7月の1.0.0リリースをきっかけに様々なプロジェクトで採用が進みました。2022年6月現在の最新バージョンは8.0.0です。

Apache Arrowの主な機能には次のような機能があります。

活用事例

Apache Spark™をはじめApache Arrowを利用して高速化したデータ処理プロダクトが増えています。Apache ArrowのPythonライブラリーであるpyarrowだけでも、2020年8月23日の1日のダウンロード数は約23万件です。

以下にApache Arrowの利用例を紹介します。

クリアコードについて

クリアコードは、2006年7月にフリーソフトウェア開発者を中心に設立したソフトウェア開発会社です。クリアコードの目的は、単に会社を継続していくことではありません。フリーソフトウェアの開発で学んだことを継続的にビジネス分野に活用していくことで会社を継続し、それと同時に、ビジネスを継続することでフリーソフトウェアへ継続的にコミットメントしていくこと、この両立の実現が当社の目的です。この理念は、我々がフリーソフトウェアの開発で学んだことがベースとなっています。現在、Apache Arrow・Groonga・Fluentdといった様々なソフトウェアのコアメンテナが在籍しています。

クリアコードのApache Arrowコンサルティングサポート

クリアコードでは、Apache Arrowによる大規模データ交換の効率化を目指すお客様や、Apache Arrowをどのように活用したらよいか相談に乗って欲しい、Apache Arrowを使っていて解決したい点があるお客様に対して、コンサルティングサポートを提供しています。

開発当初からプロジェクトに関わっている須藤をはじめ、FluentdやGroongaといったデータを扱う様々なOSS開発・メンテナンスに関わっている経験豊かなエンジニアが、Apache Arrowの活用だけではなく、実際の運用におけるデータ処理に関する課題や期待をヒアリングしたうえで、データ処理ツールの開発などを含めたコンサルティングサポートを提供します。まずは、お気軽にお問合せください。

参考URL

【コーポレートサイト】https://www.clear-code.com/

【本プレスリリース】https://www.clear-code.com/press-releases/20220622-the-data-thread.html

【関連サービス】https://www.clear-code.com/services/apache-arrow.html

当リリースに関するお問合せ先

株式会社クリアコード

TEL:04-2907-4726

メール:info@clear-code.com