画像AIを使う、作るのは意外に簡単②

thumb nail AI

一番手っ取り早く無料で使えるAIを使います。

それは、クラウドサービスのAIです。

クラウドサービスは

  • IBM:IBM Cloud
  • Windows:Azure
  • Amazon:AWS
  • Google:Google CP

などがありますが、今回はIBM CloudのAIを使います。私が使ったことがあるというだけで、上記の中で一番いいからというわけではありません。

では早速、下記のステップを順番に行っていきましょう!!

ibm ai step

スポンサーリンク

IBM Cloudアカウントの登録

IBMのアカウント登録はQiitaにIBMの方が投稿した記事があるので、下記参照ください。

1年前の記事なので、若干違うところあるかもしれませんが、登録には苦労しないと思います。

ログイン

下記より、ログインします

ibm cloud login

ログインすると下記のような画面になります。

ログイン後の画面は頻繁に代わります!なので、あまり気にせずこんな画面なんだくらいで良いです。

必要なところは、下記の赤枠のサービスを選ぶ「Catalog」と今動いている、サービスの一覧「Resource summary」ところです。

ibm cloud log in view

Visual Recognitionサービスの追加

VisualRecognitionはIBMが提供している画像AIです。

サービスを追加する

  1. カタログ
  2. AI
  3. Visual Recognition

の順に選びます。

select visual recognition

下記画面が出ますが、特にサービス名などは変更せずに、ライトプランを選択して、「作成」

set vr

下記画面が出て、Visual Recognitionサービスの追加が完了

この「サービスページ」の画面では、入門チュートリアルを見たり、Visual Recognitionサービスを使うのに必要なApiKeyを確認します。

done add vr service

サービスページに戻るには

上記のサービスページに戻るには、IBM Cloudのトップ画面の「Resource summary」にサービスが1つ追加されていますので、それをクリックします。

すると「リソース・リスト」が表示され、サービスの中に、追加したVisual Recognitionがあるので、クリックすると戻ることができます。

APIKeyの確認

APIKeyは今回追加した、Visual Recognitionであるかどうかを判断するものです。

サービスを使うときに必要です。

APIKeyはVisual Recognitionのサービス・ページ(Visual Recognitionを追加してすぐの画面)から、「Manage」を押すと出てきますので、青丸を押してコピーしてください。

他にも、「サービス視覚情報」からでも確認できます

Visual Recognitionを使ってみる

今回は、アプリケーションに組み込んで使うところまでは説明できないので、入門チュートリアルにある「fruit bowl」をAIに判別してもらいます。

Visual Recognition使い方の確認

Visual Recognitionの使い方は、サービス追加の後に出てきた、入門チュートリアルを見るか、下記のAPIリファレンスを見ると書いてあります。

Curl、Go、Java、Node、その他(Python、Ruby)それぞれのチュートリアルがあるので、参照ください。

私は、実際に1年ちょっとJavaを使って、VRを使っていましたので、APIリファレンスとにらめっこして、アプリケーションに組み込んでいました。

APIリファレンスは英語ですが、コードを参照したいだけなので、あまり英語アレルギーにならなくても良いと思います。

githubというプログラムコードを管理、公開していることも参考になりますが、同様に英語で記載されていますので、参照すると使い方がより分かります。

入門チュートリアルの「fruit bowl」をAIで判別

今回はCurlを使って、AIを使ってみます。

Curlについては、私も説明できないのですが、決まった書き方をすると、クラウド上のAIにデータを送って、結果を返してくれるみたいな認識でOKです。

では、実際に使ってみましょう。赤文字のところを、先ほど取得した、APIKeyに置き換えて、Macならターミナルで、Windows10ならコマンドプロンプトで実行するだけです。

青文字の部分は、fruit bowlの画像があるリンクになっています。

curl -u “apikey:{apikey}” “https://gateway.watsonplatform.net/visual-recognition/api/v3/classify?url=https://watson-developer-cloud.github.io/doc-tutorial-downloads/visual-recognition/fruitbowl.jpg&version=2018-03-19″

Mac

Finderを開いて、アプリケーション > ユーティリティ > ターミナルを開きます

後は、APIKeyを置き換えた、ものをコピペして、エンター!!

Windows10

Windows システムツール > コマンドプロンプトを起動して、同様にAPIKeyを置き換えた、ものをコピペして、エンター!!

AIの結果

結果は、JSON形式という形で返ってきますが、見るところは

“class”:「AIの結果」と”score”:「結果に対するAIの自信」です。

「fruit」とか「banana」とか出ているし、まぁあっている。「melon」はない。。。

自分の持っている画像を判定

自分が持っている画像で試す場合は先ほどのCurlの書き方が変わって、下記を使います。

赤文字は先ほどと同じで、自分のAPIKeyに置き換えてください、青文字は、自分の持っている画像のファイル名で置き換えてください。

*ターミナルやコマンドプロンプトで画像の保存先までcdを使って移動する必要があります。

*「cd ファイルの保存パス名」でファイルのフォルダーまで移動します。

curl -X POST -u “apikey:{apikey}” -F “images_file=@fruitbowl.jpg” “https://gateway.watsonplatform.net/visual-recognition/api/v3/classify?version=2018-03-19”

私の場合は、下記の画像と結果です。蕎麦とは出てないですね。。。

最後に

いかがだったでしょうか?

画像によっては、それなりに良い結果も出ると思いますが、IBMが色々な画像を学習させたAIなので、自分の思い通りの結果にならない場合が多いと思います。

そんな時は、やはり、自分専用のAIを作る必要があります。

次回は、自分専用のAIを作り方を説明します。

スポンサーリンク

タイトルとURLをコピーしました