LaunchCartな日々

LaunchCartとともに歩む日々を綴った
ブログです

言葉の説明によって自動生成するイラストAI「DALL・E(デリー)」

テクニック

言葉の説明によって自動生成するイラストAI「DALL・E(デリー)」

こちらは人工知能(AI)を研究するOpenAIという団体が2021年1月5日に自然言語処理と画像生成を組み合わせたAIとして「DALL・E(デリー)」という愛称で発表しました。
同団体より開発された、人間の様に高精度な文章を生成することができる「GPT-3」のパラメータを使用し、それによって文章からイラストや写真といった画像を生成することが可能となりました。

ここで使用されている「GPT-3」とは1750億個のパラメータで動作し、いくつかのキーワードを与えると人間が書いたような文章を生成する。その為か、「この言語モデルは危険すぎる」や「新たなブレイクスルーだ」などの議論を生むほどのもので、実際に技術者のマヌエル・アラオス氏が投稿したGPT-3に関するブログを、実は人間ではなくGPT-3が書いたものであることが話題を呼びました。

その言語モデルでありGPT-3を使用した今回の「DALL・E」は学習と推論を経て見たことがないものを予測できる様な技術となっている。

https://openai.com/blog/dall-e/

画像生成例

「ネオンサイン」「openAI」というキーワードを使う事によって下記の様な画像を生成した。

原文:a neon sign that reads ‘openai’.(openaiと読むネオンサイン)

「OpenAI」というネオンサインは現実には存在せず、すべてAIが文章をレンダリングし、作り上げています。

しかし、求められる文字列が長いほど画像生成の成功率は低くなる様です。

その他にもプロダクトデザイン、街の背景や手書きの様なスケッチも生成することが可能となっている。

この様に文章で画像を生成する技術が進歩する事によって起こる社会的影響も多く、特定の業種やサービスにとって将来的に与える影響は重要なものと考えられる。

また、これら社会的影響に関してはopenAIは認識しており、この技術が示唆する長期的な倫理的課題などの社会的課題とどのように関連しているかを分析する予定との事でした。

この記事を書いた人
yonekuraのアイコン

yonekura

気になったモノを自身の勉強の為、記録として書いています。