情報メディア基礎ゼミ/2019/第5回

機械学習による図形推定 †

機械学習ライブラリML.netを使用し，描かれたストロークの図形を推定して，整形された図形に置き換える機能を実装する．

その前段階として，推定結果をテキストで表示する．

今回は，楕円と四角どちらかを推定する，二項分類を行う．

↑

ML.netのインストール †

ML.netは.NET standard 2.0に依存している．UWPで.NET standard 2.0を使用可能な状態にするには最小ターゲットバージョンを1809にする必要がある．

ソリューションエクスプローラーから，Kisozemiプロジェクトのプロパティを開き，[アプリケーション]-[ターゲットバージョン]と[最小バージョン]を共に，1809に変更し，保存，いったんVisual Studioを再起動する．

再起動後，[プロジェクト]-[NuGetパッケージの管理]を開き，[参照]からML.netを検索し，プロジェクトにインストールする．

↑

学習モデルの読み込み †

本来，今回のような分類の機械学習を行う場合，学習データの準備と学習モデルの作成が必要となる．

しかし，時間も限られているため，今回はすでに作成されている学習モデルを読み込み，図形の分類推定に使用することとする．

以下のmodel.zipは，楕円と四角の1ストロークで描いた図形を約60個学習させたモデルとなる．

model.zip

model.zipは，プロジェクトのAssetsフォルダにドラッグ＆ドロップなどで追加し，「プロパティ」から「ビルドアクション」を「コンテンツ」にしておく．

適当なButtonを用意し，Clickイベントでmodel.zipを読み込む．

ML.netを使用するため，usingに以下を追加：

using Microsoft.ML;
using Microsoft.ML.Data;

クラスのメンバに以下を追加：

MLContext mlContext = null; 
ITransformer strokePredictModel = null;

クリックイベント内で実際にmodel.zipを読み込む，非同期処理(await, async)を使用しているため，イベントメソッドの先頭にasyncを追加すること，System.IOのクラスを使用しているのでusing System.IOを追加する必要があるが，System.IO.PathとWindows.UI.Xaml.Shapes.Pathがあいまいになるので，Windows.UI.Xaml.Shapes.Pathクラスを使用する場合，明示的にすべて書く必要がある：

           Windows.Storage.StorageFolder installedFolder = Windows.ApplicationModel.Package.Current.InstalledLocation;
           Windows.Storage.StorageFolder assetsFolder = await installedFolder.GetFolderAsync("Assets");
           Windows.Storage.StorageFile modelFile = await assetsFolder.GetFileAsync("model.zip");

           mlContext = new MLContext();

           //Define DataViewSchema for data preparation pipeline and trained model
           DataViewSchema modelSchema;

           // Load trained model
           using (System.IO.Stream stream = await modelFile.OpenStreamForReadAsync()) //using System.IO;が必要
           {
               strokePredictModel = mlContext.Model.Load(stream, out modelSchema);
               stream.Flush();
           }

注意

UWPで作成されるアプリはiOSやAndroidのアプリ同様に，端末内のストレージに自由にアクセスすることはできない．

そのため，

           Windows.Storage.StorageFolder installedFolder = Windows.ApplicationModel.Package.Current.InstalledLocation;
           Windows.Storage.StorageFolder assetsFolder = await installedFolder.GetFolderAsync("Assets");

によって，プロジェクトのAssetsフォルダの場所を取得し，そこからmodel.zipを読み込んでいる．

            Windows.Storage.StorageFolder storageFolder = Windows.Storage.ApplicationData.Current.LocalFolder;

また上記では，アプリが自由に使えるフォルダを取得できる．

↑

図形の推定 †

以下の.csファイルをプロジェクトに追加する．中には機械学習用の入力データ(StrokeData)，出力データ(StrokePredict)クラスが定義されている．

StrokeData.cs

学習モデルを読み込んだ状態であれば，ストロークを描き終えた後，そのストロークを特徴ベクトルに変換し，それを学習モデルに入力，図形の推定を行い，推定結果を基に該当する図形をストロークの大きさ，位置に生成する．

以下のdrawingStrokeは描画中のWindows.UI.Xaml.Shapes.Pathである．

      private void MainCanvas_PointerReleased(object sender, PointerRoutedEventArgs e)
      {
          //drawingStrokeがnullでなければ，描き終わったことを示すためnullにしておく
          if (drawingStroke != null)
          {
              if (strokePredictModel != null)
              {
                  var predEngine = mlContext.Model.CreatePredictionEngine<StrokeData, StrokePredict>(strokePredictModel);
                  var result = predEngine.Predict(GetStrokeData(drawingStroke));
                  if (result.Prediction)
                  {
                      AddMessage("Ellipse");
                  }
                  else
                  {
                      AddMessage("Rect");
                  }
              }

              drawingStroke = null;
          }
      }

       private void AddMessage(string str)
       {
           StatusBlock.Text += str + System.Environment.NewLine;
           StatusBlockScroll.ChangeView(0, StatusBlockScroll.ScrollableHeight, StatusBlockScroll.ZoomFactor, false);
       }

       StrokeData GetStrokeData(Windows.UI.Xaml.Shapes.Path stroke)
       {
           StrokeData data = new StrokeData();
           data.DirCount = new float[360];

           //DirCountにに ストロークを特徴ベクトル化したデータを生成（後述）

           return data;
       }

↑

ストロークから特徴ベクトルの生成 †

ストロークの点群そのままでは，機械学習に使用できないため，特徴ベクトルへ変換する．

今回は，ストロークを構成する点群の差分ベクトル（Pi+1 - Pi）を算出し，その角度を整数値0～359とし，各角度の出現回数をカウントすることで，360次元のベクトルを特徴ベクトルとする（少なくとも楕円と四角ではその分布は大きく異なるはず，という仮定）

ヒント：

data.DirCount = new float[360];
//点群全体に以下の処理
//差分ベクトルの角度をMath.Atan2で算出し0～359整数値に変換->deg
data.DirCount[deg] += 1.0f;
//一通り終わったら全体から最大値を求める->max
//すべてをmaxで割り正規化
data.DirCount[i] /= max;

↑

課題提出方法 †

招待されているBoxアップロードフォルダ「情報メディア基礎ゼミ（森谷）」の「第5回」へ，完成させた課題のソリューションフォルダをZIP圧縮し，ファイルを以下の名前でアップロードしてください．

ファイル名：XXFIXXX_5th.zip（例：18FI999_5th.zip）

提出締め切り：7月18日（金） 23:59

BOXアップロードフォルダの招待メールが来ていない方は森谷までメール連絡ください．