HOW TO・TIPS
侮れない!脅威のイラスト生成AIツール「Midjourney」
こんにちは!エレファントストーン ディレクターの光武です
突然ですが、読者の皆さんはAIと聞いて何を思い浮かべるでしょうか。
画像生成、文章の要約や翻訳チャットボットなど、暮らしに欠かせない様々な用途があります。それだけでなく最近は楽曲の作成など、クリエイティブな仕事にも活用され始めています。
今日はそんなAIを活用した画像生成サービスの一つである“Midjourney”について実際に使ってみた感想を踏まえて紹介していきます。
AI画像生成サービスとは?
画像生成サービスとは、その名の通りAIが画像を自動生成してくれるサービスのことを指します。
画像と一口に言っても、写真やイラスト、さらに作風を分けると「ポップな感じ」「シリアスな雰囲気」「アニメ風」などさまざまな画像を作成することができます。一つの作風に捉われることなく対応できる点に、AIが本領発揮している感じがありますね。https://stablediffusionweb.com/
また、画像生成サービスも複数あり、「Midjourney」「にじジャーニー」「Stable Diffusion」「Adobe Firefly」などそれぞれ違った特徴を持っています。実際に画像を生成する方法はサービスによって異なりますが、すべてのサービスに共通する生成の方法として、“プロンプト”と呼ばれる指示文を入力することが挙げられます。プロンプトがいかに具体的に明確に書かれるかによって画像・イラストの精度も変わってきます。
例えば、スマートフォンと言われても、iPhoneなのかAndroidなのか、色は白なのか黒なのかなどの判断がつかないように、AIも指示者のを意図を読み取れないですよね。そのため、「白いiPhoneで画面にはアプリが並んでいる」といったように、思い浮かべているものをなるべく細かく指示してあげることが重要です。
今回は、数あるサービスの中でもユーザー数が多くブームの火付け役となったMidjourneyについて紹介して紹介していきます!
Midjourneyでイラストを作ってみる
さて、ここからは実際にMidjourneyを使ってイラストを生成していきます。Midjourneyは、Discordのメッセージでプロンプトを入力することで画像を生成してくれます。
プロンプトと聞くと、専門用語を駆使した難しい技術で事前知識が必要なように思われますが、実はそうではありません。たったの4ステップ、時間にして5分以内に簡単にイラストを生成できます。
①描きたい絵の大まかなイメージを決める
今回は、1890年代の日本の街の様子をシルエット風のイラストで表現することにします。
②ChatGPTに詳細な情景を解説してもらう
大まかなイメージが決まったら、プロンプトを具体的な内容にするために「1890年代の日本の街」というイメージを深掘りしていきます。今回は、ChatGPTを活用したいと思います。
※史実に関しては、間違った回答をされる可能性もあるので気をつけましょう
③微修正を加えて、上記の文章を英訳してもらう
Midjourneyは今のところ英語にしか対応していないため、上記の回答を英語化しなければなりません。しかし、ここもAIを活用して翻訳してしまいましょう。
※DeepLやGoogle翻訳などありますが、今回はそのままChatGPTを使用しています。
AIによる翻訳は違和感のある部分もありますが、スペルミスなどのヒューマンエラーを防ぐという利点があります!
④文章をコピペして、縦横比などを指定する
ここまできたら、あとは「/prompt」のあとに、その文章をコピペするだけ!
⑤生成完了!
いかがでしょうか?
【生成された画像】
【「1890年 日本 街並み」で検索した際の歴史写真】
上の写真が生成された画像、下の写真が「1890年 日本 街並み」で検索した際の歴史写真になります。建物の大きさや建築様式など、指示通り且つ近いイメージで再現できているのではないでしょうか?
このクオリティが5分以内でできてしまうのがMidjourneyなのです。
Midjourney独自の機能
①生成した画像のクオリティアップ
Midjourneyでは、指示を出すと4枚の画像が出力され、画像の下に複数のボタンが出現します。
これを使うことによって生成した画像のクオリティアップを図れます。
◼️アップスケーリング(U1~4)・・・生成された4つの画像の中から特定の画像の解像度を上げます。
◼️バリュエーション生成(V1~4)・・・生成された4つの画像の中の気に入った画像のレイアウトを踏襲しつつ他の案を4枚生成します。
②アニメイラストに特化した“にじジャーニー”
Midjourneyで定額課金をしている場合は、アニメーションイラストに特化したサービス“にじジャーニー”を使うことができます。アニメ色が強いので用途は限られてきますが、YouTubeのサムネイルやアバター作成などに活用することができます。また日本語にも対応しているため、より手軽に使用することができます。
実際に使ってみて感じたメリットとデメリット
メリット
①幅広いイメージ作成ができる
指示さえ明確であれば、3DCG/アニメ風/シルエット/塗り絵などさまざまなテイストで画像を生成することができます。さらには有名画家や写真家風に生成することができます。
ただし、知名度が低かったり一般的に浸透していないような単語や固有名詞は読み取ってくれないようです。
②短時間でクオリティの高いイメージイラストが作成できる
先ほど実際に生成したように、わずか5分ほどで高クオリティの画像を作成することができます。
どんなに偉大な画家であっても、1分で高精細なイラストを描くのは難しいでしょう。その域に達するためには、膨大な経験値と知識量が必要になってきます。AIなら、その経験をデータでまかない、数式を素早く計算して処理することができます。
また、外部のクリエイターに発注する場合などは特に「擦り合わせる時間」+「作業してもらう時間」が必要となり、どう考えても1分で終わるような作業ではありません。その差を埋めることができるのがこのAIの最大のメリットの一つでもあります。
③AIならではの“味”で想像力を刺激する
やはりAIサービスなので、直接人に指示するのとは違ったニュアンスの読み取り違いがあります。
しかし逆にその違いを逆手にとって、「こっちの方がいいじゃん!」「こういうテイストもありじゃん」というふうに思わぬ手助けになることがあります。実際に案件の中で絵コンテ作成時にこのサービスを利用してみて、そのような考えの変化がありました。
デメリット
①AIならではの、イメージの偏りがある
AIにも苦手なことがあります。それはデータが少なかったり、偏りがある物体を生成することです。例えばよく言われる話だと、人間の手を描くときに指の本数を間違えたり、Japan/Japaneseなどの単語を使うと五重塔や東京タワーが描かれたりしてしまうという点があります。
回避するためのコツとしては、とにかく詳しく指示することです。上記で実践した通り、「建物」ではなく「レンガでできた茶色い建物」というふうに、誰が聞いても同じものを想像できるように意識しながらわかりやすく指示しましょう。
②使い始めには時間がかかる
やはり簡単に画像を生成するサービスとは言っても、指示の出し方など使い始めは慣れるまでに時間がかかります。そんな時はぜひプロンプトの参考などを検索してみましょう。
僕がよく参考にしているサイトは以下です。
・【画像生成AI】Midjourneyでプロンプトによく使う言葉まとめ
世界観や構図、色味など、画に関するさまざまなキーワードが載っています。
・Midjourney artists
世界のさまざまなアーティストの画風をMidjourney上で、生成するとどのような物が出てくるかが一覧で出てきます。
まとめ
いかがでしたでしょうか?今回はAI画像生成サービス「Midjourney」を紹介しました。
一事例しか紹介できなかったのですが、画像生成という最新技術のメリットを感じていただけたのではないでしょうか。私も絵コンテ作成などの際に利用していますが、他にも良い用途があれば積極的に活用していきたいです。ぜひ、最新技術に触れて仕事に活用していただければと思います!
映像制作のエレファントストーンが運営する本メディアZOORELは、映像やクリエイティブにまつわるトレンドやノウハウを発信しています。最新情報は以下のメールマガジンにて更新中。お気軽にご登録ください!