去年の3月に生成AIで画像を作ってみた記事を投稿したんですが、
たった1年前の記事を見返してみて驚いてしまいました。
よく「生成AIの進化は目まぐるしい」って言いますが、
実際に1年前の画像と見比べてみると、その言葉の意味がひしひしと伝わってきます。
当時は「AIでここまで作れるなんて!」って感動していた画像が、
今見ると明らかにAI感丸出しのクオリティで…。
画像生成が誕生して間もない時代だったとはいえ、
「これが写真と同じクオリティ!」って書いていた自分が、ちょっと恥ずかしいくらいです。
この1年、いろんなジャンルの生成AIを試して研究してきましたが、
「これはちょっとサボると、すぐに置いていかれちゃう」っていうのを身にしみて感じてしまいました。
1年前のクオリティがもう通用しない…
生成AIの世界って、本当に日進月歩です。
今回は、当時とはツールは変えていますが、できるだけ同じような条件で画像を生成してみました。
その違いを見比べると、この1年の進化がはっきりと見えてくると思います。
では、実際にその進化を見ていきましょう!
生成AI感が透けて見える2024年版のクオリティ
2024年3月ビフォー
言わなければ気づかないかもしれませんが、生成AI顔というか、AI肌感というか、細かくみていくと、ツッコミどころがありますね。おそらく、「シワ」に違和感があるのだと思います。年齢に限らず、ほうれい線の出方が強い画像が多いです。
2025年1月アフター
同じような条件で生成しました。一発だしです。
もうモデルに素人感が残っておらず、タレントレベルですね。。シワも自然です。衣装や髪のセットに至るまで、ツッコミどころを探すのが大変なくらいです。時計の針がないくらい?iphoneを持ってるのにも驚きです。これは、モデル不要とまで言えるレベルではないでしょうか。少なくともストックフォトの代替えはできるレベルです。
採用系フレッシュウーマン
こちらは、多少自然なカットのため2024年版も十分使えるレベルだと思います。強いていうなら、髪型に乱れがあるのが生成AIの癖だと思います。
きっちりスタイリングしたような髪型にはなりません。それが素人感があって良いこともあるのですが。
2024年ビフォー
2025年アフター
こちらも一発だしです。
多少髪の毛の乱れはありますが、セットにスタイルリストがついたような雰囲気ですね。やはり素人モデルから一流タレントに変わった感はあります。2024年はカメラ目線を外すのが難しかったのが、かなり自然な感じでカメラ目線をはずるようになった気がします。
背景が異質だった2024年工場作業
次は工場内の写真です。
2024年ビフォー
女性の生成はうまくいっていたのですが、この当時は女性に工場内作業をさせるカットが難しかったです。(カメラ目線になる)
それに工場の背景に違和感がありましたし、何の工場?作業着何?みたいなよく見ると破綻している写真でした。
2025年アフター
一発だしです。
多少は違和感ありますが、まずは、女性が真剣に作業をしている程のカットが一発で作れました。笑顔だけでなく、真剣な表情も表現できています。背景の工場も2024年版に比べると自然な進歩です。作業着も2024年版のクタクタの作業着に比べると撮影用に準備した感はあります。
多少の違和感はまだありますが、ちゃんと作業している感じだせそうなのが驚きでした。
男性複数人は、破綻していた2024年
2024年の生成AIの課題としては、男性・複数人は、破綻の原因間違いなしでした。
2024年ビフォー
生成AIの画像が女性一人が多いのは、成立しやすいからという理由がありました。男性は違和感がより強いですし、複数人だと関係性が成立していないことが多いです。
複数人の会話の写真になると、誰も目線が合っていないのに笑っているよく見るとカオスな写真に仕上がります。
2025年アフター
一発だしです。
まず、男性の表情に違和感がなくなったのが驚きです。女性よりもより自然かもしれません。見比べると一目瞭然で分かるのですが、しかっりと相手の表情をみて話しています。ビフォーと比べると統一感は一目瞭然です。
名刺交換は2025年も違和感あり
名刺交換は2025年も課題を感じます。日本独自の文化?で、学習素材が少ないからでしょうか。
2024年は不成立
なぜか、モデルが全てカメラ目線で、カードの受け渡しも破綻しています。
2025年はギリギリ。でも違和感あり
2024年と比較すると、雲泥の差ですが、機械的というか、ぎこちなさが残ります。
目線もずれているのでこれは2025年でもダメした。片手で受け渡したりと、コントロールも難しかったです。
まとめ
2024年と2025年の比較、いかがでしたか?
2025年版は明らかに精度が上がっていて、驚きを感じた方も多いのではないでしょうか。
ただ、逆に「完璧すぎる」という新たな課題も見えてきました。あまりにも綺麗に仕上がりすぎて、かえってそこに生成AI特有の不自然さを感じてしまうのも多少ありました。
自然な「味」や「わざとらしくない雰囲気」まで表現できれば、本当に実写と見分けがつかなくなるかもしれません。
この進化のスピードを見ていると、そんな日も案外近いのかも?来年にはもう実現しているかもしれませんし、あるいは新しいプロンプトのテクニックで突破口が開かれるかもしれません。
とはいえ、現時点でもストックフォトを超えるクオリティを実現できているのは間違いありません。
生成AIの活用にご興味がある方は、ぜひお気軽にご相談ください。
2025年は動画にも期待
2024年後半辺りからは動画の話題も多かったです。動画は始まった感が強いですが、動画の進歩にも期待しながらこれからも最新トレンドをキャッチアップしていきたいと思います。
※上記で生成した画像を動画に書き出してみました。