xgboost-predictor 0.1.8 のリリースメモ

xgboost-predictor 0.1.8 をリリースしたのでメモを残しておきます。

0.1.8 での変更点

元々は俺得ライブラリとして作っていた xgboost-predictor ですが、世の中にはごく僅かながら、こんなにも用途が限定されているライブラリを使ってくださる方々がいらっしゃるようなので、ときどき issue に上がってくる質問に答えたりちょこちょことメンテナンスしています。

今回の 0.1.8 は「Spark で使おうとすると Task not serializable の例外が出てしまう」 #11 の issue に対応するリリースとなります。何のことはない、Serializable インタフェースを Predictor クラスなどに適宜実装しただけのことです。機能面では何の変更もありません。

今後の予定

このライブラリは XGBoost4J の速度性能に不満を覚えたことをきっかけに作り始めたわけですが、速度性能の向上余地は ASM を利用したコード生成以外はほとんど残っていない (& 内部構造を改造しなきゃいけないため面倒な) ため、今後は使い勝手を向上させる方向での進化を考えています。今のところは issue に上がっているとおり、

  • Scala API の提供
  • Spark MLlib API との統合

あたりに対応していくつもりです。ただ、本家 XGBoost4J がすでに Scala / Apache Spark 対応しているんですが、それとの棲み分けはどうしたらいいものやら…