app

アップル、画像生成AI「MLLM-Guided Image Editing (MGIE)」を発表。でもだいぶやっつけ


アップルの研究者らが、カリフォルニア大学サンタバーバラ校の研究者と協力して開発した画像生成AI「MLLM-Guided Image Editing (MGIE)」を2月5日に発表していました。

「MGIE」はテキストによる命令文を理解して画像を編集するAIで、「画像生成AI」というよりも「画像編集AI」といった感じのAIですが、ともかくアップル製の画像生成AIです。

「MGIE」は、オープンソースバージョンが「GitHub」で公開されています。

が、ギフハブ? 謎の組織か? みたいによく分からない人が大半だと思われますので、そういう人のためにAIプラットフォーム「Hugging Face」でデモバージョンが利用できるようになってます。

「MGIE」、実際に使ってみた

というわけで早速「MGIE」を使ってみました。


こちらのマックスむらいの写真を読み込ませて、「サングラスをかけさせて」と命令してみました。

その結果がこちら。


……うーん、サン、、、グラス?

なんかテキトーに黒で塗りつぶしたというか、青い眉毛も生えてるしでだいぶやっつけ感があります。

これだけではアレですので、今度は「メガネを外して」と命令してみました。

その結果がこちら。


……こわ! マックスむらいこわ!

宇宙人みたいになってるし、パーカーのマックスむらいロゴも消えています。

こいつはマックスむらいじゃない! 別の何かだ!!!

「Hugging Face」のデモは以下のページから利用できます。

MLLM-guided Image Editing (MGIE) – a Hugging Face Space by tsujuifu

Source: app