ストリーミングはほとんどのブラウザと
Developerアプリで視聴できます。
-
Create MLでテキスト識別モデルをトレーニングする
Create MLで、最先端のテクニックを基盤にした自然言語処理モデルを作成できるようになりました。このセッションでは、Create ML Appを使用して、テキスト識別モデルのトレーニングとテストを簡単に行う方法を紹介します。転移学習、単語の埋め込み、テキストカタログのための強力な新しいオプションについてご確認ください。
リソース
関連ビデオ
WWDC19
-
ダウンロード
(音楽)
(拍手) 皆さん こんにちは ようこそ Core MLチームのタオです 今日はCreate MLの新機能を 紹介しましょう 機械学習セッションで― 新しいCreate MLアプリケーションは ご覧になりましたね これはトレーニングや― 機械学習モデルの手順を 案内してくれるツールです 機械学習のワークフローを 容易にするでしょう
テキスト分類から説明します
テキスト分類とは? 文章を所定のラベル別に分類する 機械学習のタスクです
感情分析に使えます 文章がポジティブか ネガティブか判定できます
さらにスパム検出や―
複雑なトピック分析の分類も可能です 例えば食べ物 政治 科学に分類します テキスト分類は昨年からありましたが 今年は最新の転移学習を加えました 今日は転移学習を使った― テキスト分類器のトレーニング法を お見せします
モデルをトレーニングするには データが必要です
データを集めたら簡単に整理します スポーツと娯楽と自然の 各フォルダに― テキストファイルが入っています それぞれがトレーニングの サンプルで― ラベル名は フォルダの名前になります
データが準備できました 転移学習のデモを始めます
これはトレーニングデータです
少し遊び心を加えて― 文字の代わりに絵文字を使っています “娯楽”はビデオカメラで― “スポーツ”は アメリカンフットボールです
“自然”はテントと松の木の絵文字です
“その他”というフォルダも ありますが― これは上の3つ以外のデータです 上の3つのカテゴリと関係ない文章は ここに分類するよう― モデルをトレーニングしたいのです
サンプルを見てみましょう 映画のオンラインデータベースに ついての文章なので― 明らかに娯楽です
“その他”のフォルダは―
3つのフォルダとは違う内容です
データの準備はできました
次はCreate MLです
Developer Toolsから Create MLを開いてください
新しいドキュメントを作るので テキストを選択します
名前を付けて― Createを
前のセッションで 接続オブジェクトや― 下位分類はご覧になりましたね ではデータをドラッグで持ってきます
データのフィードバックが 返ってきますが― 今回の新機能は このパラメータセクションです
今日のデモでは転移学習を選択します
上の2つのアルゴリズムは 昨年からのもので― 今年 転移学習が加わりました 今から動的埋め込みという機能を 使います 転移学習の詳細は デモの後でお話しするとして― 先に動的埋め込みの 転移学習についてです これは入力した文の意味論的意味に 注目するアルゴリズムです
トレーニングを始めます 通常 トレーニングは時間を要します このデータセットで おそらく5分かかるでしょう しかし今回はあらかじめ―
同じデータでトレーニング済みの モデルを用意しました
トレーニングが終わると― さまざまなデータにおけるモデルの 学習状況の結果が示されます ご覧のモデルはよい結果が出ていますね ではOutputタブに飛びましょう このプレビューではモデルの概要の 閲覧と― いくつかの簡単なテストができます 例えば この隅のところから― ファイルを追加しテストできます
またはフォルダを移動し モデルが―
フォルダ内の全テキストファイルを 予測に使えるようにします テストは各ファイルの文をすべて使い 予測をします
または手動で文字を打ち テストすることもできます
このテキスト入力画面では スペースを打ち込むか― タイピングを中断すれば モデルが予測します 見てみましょう
“逆転勝利です”
スポーツです
違う文を入れます
“シーズン最終話は 思わぬ展開が待っています”
正解ですね 娯楽です (拍手) もう少し最近の話題にしましょう 昨夜 思いつきました
“ラプターズが…” “今 いるのは…”
“山頂です”
自然 (笑い) 後半を変えます
(拍手) スポーツですね (拍手)
うまくいって うれしいです デプロイは― モデルを外にドラッグして iOSデバイスに入れるだけです
転移学習を用いた テキスト分類器の トレーニングでした 転移学習とは何でしょう?
転移学習は あるタスクの膨大な データを学習したモデルを― 別のタスクに使う技術です そのため開発者は わずかな量のデータを用意すれば― 自分のモデルが作れます
実際 Create MLは画像分類の 転移学習を使っています 次はテキストに応用します
テキストの転移学習モデルの トレーニングは―
少し課題があります この文を見てください “私は公園の入り口近くに停車できた”
従来の技術や学習埋め込みで トレーニングしたモデルは― 2つの意味の“park”を 同じと認識します
しかし動的埋め込みの転移学習で トレーニングしたモデルは― 文の意味論的意味を認識できます つまり2つの“park”の違いが 分かるのです
よいモデルにするには 多くのトレーニングが必要です 私たちは膨大なトレーニングをし―
モバイル機器に搭載しました しかもパフォーマンスを 最適化したのです 開発者はわずかな量の文章を 準備してCreate MLに―
送るだけです 送られた文はOSに 組み込まれたモデルと連携し―
独自のテキスト分類器が作られます
そしてiOSデバイスに シームレスにデプロイできます それもトレーニング済みの モデルだからです
テキスト分類器をトレーニングする Create MLのワークフローでした
もしコードを書きたいなら簡単です このモデルパラメータを指定すれば― 動的埋め込みの転移学習を使えます あとのコードは昨年と同様です
テキスト分類器のトレーニング法を 紹介しました 最後に優秀なテキスト分類器を作る コツをお伝えしましょう
事例に応じたアルゴリズムを 選ぶことです テキスト分類器には転移学習の他に 2つのアルゴリズムがあります
それぞれ特徴があります どれが事例に最適か― この後のNatural Languageセッションを 参考にしてください
偏りのないサンプルの提供が重要です テキストファイル1つが 1つのトレーニング例と認識されるため デモでは 各フォルダの ファイル数をそろえました
データ整合性です 私の例のように 短い文を扱う分類器なら― トレーニングデータも 短い文であるべきです 短い単語や文章 そして記事を扱う分類器なら― トレーニングデータも それに準じてください (拍手)
-
-
特定のトピックをお探しの場合は、上にトピックを入力すると、関連するトピックにすばやく移動できます。
クエリの送信中にエラーが発生しました。インターネット接続を確認して、もう一度お試しください。