AI DeepLearning

今どんなことができる?画像DeepLearning、気なる技術まとめ

個人的に、気になっているものを紹介していきます。

GitHubにソースでているものは、ソース見ながら、順番に試していこうかなと思います。

  • 存在しない人の顔を作る
  • 表情まで真似て、顔を入れ替える
  • 体の動きを真似させる
  • 体、顔、手の動きを検知する
  • 1枚の絵が喋る

そんな、最近の画像系のDeepLearningでどんなことができるか知りたい方、参考ください。

フル活用すれば、好きな人物作って、YouTubeとかできそうな気もします。

VTuberの次は、F(ake)Tuber???

スポンサーリンク

DeepFake

顔を入れ替えるのですが、ただ入れ替えるのではなく、AIが表情を似せて、入れ替えます。

映画のスタントマンの顔を俳優に変えるとか、結婚式の余興とか色々活用できそうですが、

悪用されることの方が圧倒的に多い?技術です。

せっかくの技術なので、問題があるなら、法整備とかで、こんな使い方はOKですよ!とかを示して欲しいなと思います。

問題が多いからだと思いますが、もともとあったFakeAppというアプリはダウンロードできなくなっていました。*2019年8月時点

記事

ainowをよく見るので、そこから引用させていただきます。

上記の元記事

https://towardsdatascience.com/family-fun-with-deepfakes-or-how-i-got-my-wife-onto-the-tonight-show-a4454775c011

GitHub

iprerov/DeepFaceLab

https://github.com/iperov/DeepFaceLab

faceswap

https://github.com/deepfakes/faceswap

FakeApp

削除されています。

DeepAnime

ちょっと前に、自動で着色してくれるAIが出ましたが、今度は喋ってくれます。

素人が書いた絵を、自動で着色して、アニメーションにしてくれるのなら、

ちょっと絵を描いてみようかなと思わせてくれる技術です。

サイト

https://www.algoage.net

Youtube

GitHub

なさそうです。

Character Animation from a Single Photo

一枚の絵から、人やキャラクターが飛び出して動き出します。

DeepAnimeより衝撃的です。動画のインパクトがすごい。

ARで活用しているところも、何かしら使えそうで面白そうです。

試してみたいけど、githubにコードがない、、、

論文読んで実現するのも、大変そう。

記事、論文

https://grail.cs.washington.edu/projects/wakeup/
https://arxiv.org/abs/1812.02246

YouTube

GitHub

なさそうです

A Style-Based Generator Architecture for Generative Adversarial Networks

GPUメーカーのNVIDIAが公開している、実在しない人の顔を作ったり、複数人の顔を足し合わせたりすることができます。

架空のアイドルを作るものもありますが、記事読んでいると「生成したアイドルとユーザーの情報紐付け」「合成音声でせりふを読み上げる機能」「ボディーを自動生成する機能」

と、なんでもありですね。

基本的なDCGANは使ったことがありますが、試してみたかっただけだったので、こんな鮮明な画像まで作ったことはありません。

せっかく、GitHubのコードがあるので、試してみようと思います。

論文

https://arxiv.org/abs/1812.04948

YouTube

GitHub

https://github.com/NVlabs/stylegan

アプリ

上記のコードを活用したアプリ。数秒で実在しない人の顔を作ってくれます。

https://thispersondoesnotexist.com

Everybody Dance Now

人の動きを真似してくれる技術です。

現状は、みたら普通にAIが作ったとわかるものですが、これからわからないレベルにすぐ

なってしまうのだろうと思います。

動画を見て、私はちょっとニンマリ、笑ってしまいました。

記事

https://carolineec.github.io/everybody_dance_now/

論文

https://arxiv.org/abs/1808.07371

YouTube

GitHub

なさそうです

Google HandTracking

手、指の動きを検知してくれ、手のジェスチャーも検知します。

スマフォで動く軽量なもので、GitHubで公開されています。

ジェスチャー操作とかできるようになるだろうし、スマフォのシャッターはそのうち

bluetoothのスイッチでなくて、ジェスチャーになったりするのでしょうか?

他にも活用の幅は広そうです。

記事

https://ai.googleblog.com/2019/08/on-device-real-time-hand-tracking-with.html

GitHub

https://github.com/google/mediapipe/blob/master/mediapipe/docs/hand_tracking_mobile_gpu.md

OpenPose

体の関節、手足の検知、顔、目鼻の検知をしてくれます。

これは少し、時間が経っていて、スポーツの解析や、転倒検知など活用されています。

商用利用の場合は年額25000ドルかかりますが、非商用は無料で試しても良いものです。

私は競泳をするので、オリンピック選手と数値で比較だ!と思っても、水泡立つし無理?

論文

https://arxiv.org/abs/1611.08050

GitHub

https://github.com/CMU-Perceptual-Computing-Lab/openpose

-AI, DeepLearning
-, , , , , ,

© 2020 ひつじ工房 Powered by AFFINGER5