Azure SDKを使って開発する機会がありました.ベータ版でしか出ておらず,ソースコードをいじりながらAzure APIを叩く機会があり,SDKの中身が徐々にわかったのと,Azure SDKはオープンソースで開発されているのとでせっかくならと気づいた改善点やちょっとした修正をプルリクしてみました.過去にはhuggingface利用してた時にM1chip対応じゃないライブラリにイシュー出したりしたくらいで,自分で何かがっつりコード提供しようとしたのは初です.まあ,面白かったかも.マージされればアツイ.
1つ目のプルリクはこれ
こちらはAzure SDKの中でもText Analyticsというクライアント側用のライブラリになっていて,いくつかの機能についてサンプルコードが書かれています.5.2.0から5.3.0-beta.1になるに従い何個か機能が追加されたりするようで,まだ全部が全部動くコードではないっぽいです(2023年2月現在はSummarization系のサンプルコードに載ってるbegin_abstract_summaryやbegin_extract_summaryメソッドはない.)
個々の機能についてのサンプルコードは5.3.0-beta.1に向けて整備されているようなのですが,それらの機能のラッパー関数のMultiple Analysisなる機能についてのサンプルコードが無かったので書きました.Web上のSDKの仕様(クラス定義やメンバ関数など)をみながらコードを書くのはそこまで難しくはないのですが,デバッグのためにAzureでProject→データ→モデルの学習→デプロイを行うのが億劫でした.データに文字化けした文字が入ってたりしてたので,それをMicrosoftに報告したりとかデータクリーニングしたりとかに時間を食われた気がします.後から見たらAzure SDK for PythonはオープンソースだけどMicrosoftの社員さん以外あんまりプルリクはしてなさそうなので,大丈夫かな.頑張って書いたし通ればいいな〜.レビューとか返事は絶対欲しい...!!!
2つ目のプルリクはこれ
こっちは単純にREADME.mdの表記揺れが気になったのでついでに修正したのみです.
イシューはこれ
で,ドキュメント上のサンプルコードに不備があるよーとか指摘したものです.
(2023/02/09追記) 2個目のプルリクがマージされました!
あと,味を占めてAzure Docsにも気づいたイシュー投げときました(こっちは開発が盛んじゃなさそうだから反映はされなさそうな気がするが...)